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随 着 我 国 机 械 工业 的 快速 发 展 ， 从 事 机 械 行业 的 工程 技术 人 员 数 量 不 断 增 
加 ， 如 何 尽快 提高 机 械 工 程 技术 人 员 尤 其 是 初 、 中 级 技术 人 员 最 基本 的 机 械 设 
计 能 力 ， 在 最 短 时 间 内 尽快 掌握 工程 中 常见 的 优化 设计 方法 ， 是 我 们 编写 本 书 
的 初 训 。 

优化 设计 为 设计 提供 了 一 种 重要 的 科学 设计 方法 ， 因 而 是 构成 和 推进 现代 
设计 方法 产生 与 发 展 的 重要 内 容 。 优 化 设计 是 工程 技术 人 员 进 行 设 计 的 重要 技 
术 ， 该 技术 建立 在 最 优化 的 原理 和 方法 的 基础 上 ， 借 助 计算 技术 与 计算 机 这 一 
强 有 力 的 手段 ， 对 某 项 设计 问题 ， 在 规定 的 限制 条 件 下 ,优选 设计 和 参数， 使 某 
一 项 或 某 几 项 设计 指标 获得 最 优 值 的 设计 技术 。 采 用 优化 方法 ， 对 提高 新 产品 
的 设计 水 平和 改进 现 有 设备 的 设计 方案 是 极 有 价值 的 。 

优化 设计 涉及 的 数学 基础 较 深 ， 设 计 方 法 类 型 多 ， 设 计 难 度 也 很 大 。 如 何 
将 各 种 优化 设计 方法 概括 成 浅显 易 懂 的 方式 来 表达 ， 使 读者 在 最 短 时 间 内 消化 
理解 ， 是 我 们 编写 的 难题 。 本 书 的 编写 有 如 下 特点 : 

1. 编写 采用 通俗 易 懂 的 方法 ， 本 书 的 编写 以 循序 渐进 、 兼 顾 理论 与 工程 应 
用 的 原则 为 出 发 点 。 全 书 内 容 在 组 织 安排 上 上， 力求 由 浅 入 深 ， 逐 层 推 进 。 在 优 
化 方法 的 论述 方面 对 其 优化 理论 做 了 适当 深度 的 讨论 ， 并 着 重 于 概念 的 阔 述 和 
方法 的 运用 ， 便 于 初学 者 学 习 。 

2. 编写 内 容 方面 突出 实用 的 原则 。 本 书 以 实用 为 主 ， 在 阐述 每 一 种 
优化 设计 的 原理 和 设计 方法 之 后 ， 紧 接着 有 相关 的 机 械 优 化 设计 实例 ， 
实例 具有 代表 性 ， 并 且 对 设计 实例 按 步 骤 进 行 了 详细 的 解答 ， 具 有 很 强 
的 实用 性 。 

本 书 共有 9 章 ， 包 括 机 械 优 化 设计 的 基本 要 素 及 数学 模型 、 优 化 设 
计 的 理论 基础 、 一 维 搜索 方法 、 无 约束 优化 方法 、 约 束 优 化 方法 、 多 目 
标 函 数 优化 方法 、 离 散 变 量 的 优化 设计 方法 、 模 糊 优 化 设计 和 优化 设计 
软件 简介 。 

本 书 是 机 械 工 程 技术 人 员 必 备 的 技术 资料 ， 可 供 从 事 机 械 设 计 制 造 及 其 自 
动 化 专业 的 工程 技术 人 员 使 用 ， 尤 其 对 于 初 、 中 级 的 机 械 工程 技术 人 员 具 有 指 
时 意义 5 

在 本 书 的 编写 过 程 中 ， 编 者 参阅 了 大 量 文献 资料 ， 引 用 了 有 关 教 材 和 参考 
书 中 的 精华 及 许多 专家 、 学 者 的 部 分 成 果 和 观点 ， 书 后 以 参考 文献 一 并 列 出 。 
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第 工 蔓 ”机 械 优 化 设计 的 基本 要 素 及 数学 模型 


机 械 优化 设计 ， 就 是 借助 最 优化 数值 计算 方法 和 计算 机 技术 ， 求 取 机 械 工程 问 
题 的 最 优 设计 方案 。 进 行 最 优化 设计 时 ， 首 先 必 须 将 实际 问题 加 以 数学 描述 ， 形 成 
一 组 由 数学 表达 式 组 成 的 数学 模型 ， 然 后 选择 一 种 最 优化 数值 计算 方法 和 计算 机 程 
序 ， 在 计算 机 上 运算 求解 ， 得 到 一 组 最 佳 的 设计 参数 。 这 组 设计 参数 就 是 设计 的 最 
优 解 。 

数学 模型 是 对 实际 问题 的 数学 描述 和 概括 ， 是 进行 优化 设计 的 基础 。 优 化 问题 
的 计算 求解 完全 是 围绕 数学 模型 进行 的 ， 也 就 是 说 ， 优 化 计算 所 得 的 最 优 解 实际 上 
只 是 数学 模型 的 最 优 解 。 此 人 解 是 否 满足 实际 问题 的 要 求 ， 是 否 就 是 实际 问题 的 最 优 
解 ， 完 全 取决 于 数学 模型 与 实际 问题 的 符合 程度 。 因 此 ， 根 据 设计 问题 的 具体 要 求 
和 条 件 建立 完备 的 数学 模型 是 优化 设计 成 败 的 关键 。 

综 上 所 述 ， 机 械 优化 设计 的 基本 要 素 是 : 设计 变量 、 约 束 条 件 、 目 标 阴 数 。 





























1.1 设计 变量 





工程 问题 的 一 个 设计 方案 通常 是 用 特征 参数 表示 的 ， 一 组 特征 参数 值 代表 一 个 
具体 的 设计 方案 。 这 种 代表 设计 方案 的 特征 参数 一 般 应 选 作 该 问题 优化 设计 的 设计 


NJ 


NN 
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量 。 

设计 变量 的 全 体 ， 实 际 上 是 一 组 变量 ， 变 量 的 个 数 称 为 设计 的 维 数 ， 如 有 几 个 
设计 变量 ， 则 称 为 几 维 优化 设计 问题 。 知 将 地 个 设计 变量 按 一 定 的 次 序 排 列 起 来 ， 
构成 一 个 并 维 回 量 ， 即 写成 : 





区 
X 一 ， 一 A 2 
Xn 
式 中 ,右上 角 “T” 为 矩阵 的 转 置 符号 。 我 们 把 下 定义 为 于 维 欧 氏 空间 的 一 个 回 
量 ， 设 计 变 量 2 ，xs,，…，% 为 回 量 下 的 几 个 分 量 。 在 优化 设计 中 ， 这 种 以 个 





设计 变量 为 坐标 轴 组 成 的 实 空间 称 为 n 维 实 空间 ， 用 R 表示 ， 它 是 以 设计 变量 

X11，%2，“…，X 为 坐标 轴 的 n 维 空间 。 设 计 空 间 包 含 着 该 项 设计 所 有 可 能 的 设计 方 

案 ， 且 每 一 个 设计 方案 对 应 着 设计 空间 的 一 个 设计 回 量 或 者 说 一 个 设计 点 于 。 
任何 一 项 产品 都 是 众多 设计 变量 标志 结构 尺寸 的 综合 体 ， 变 量 多 可 以 淋 沈 尽 致 











2 机 械 优化 设计 与 实例 


地 描述 产品 结构 ， 但 会 增加 建 模 的 难度 ， 造 成 优化 规模 过 大 。 选 取 设 计 变 量 时 应 注 
意 以 下 几 避 : 

1) 抓 主要 ， 伟 次 要 。 对 产品 性 能 和 结构 影响 大 的 参数 可 取 为 设计 变量 ， 影 响 
小 的 可 先 根据 经 验 取 为 试探 性 的 当量 ， 有 的 甚至 可 以 不 考虑 。 例 如 ， 和 车辆 离合 此 弹 
笛 的 工作 频率 很 低 ， 使 用 温度 也 不 高 ， 可 以 不 考虑 共振 和 温度 对 弹簧 工作 性 能 的 影 
啊 ， 但 发 动机 的 气门 弹 筑 就 要 考虑 共振 和 温度 的 影响 。 

2) 根据 要 解决 设计 问题 的 特殊 性 来 选择 设计 变量 。 例 如 ， 圆 柱 螺旋 拉 压 弹 筑 
的 设计 变量 有 4 个 ， 即 钢丝 直径 4、 弹 簧 中 径 、 工 作 圈 和 上 自由 高 度 。 在 设计 中 将 材 
料 的 许 用 切 应 力 和 切 变 模 量 等 作为 第 量 ， 在 给 定 径 癌 空 间 内 设计 弹 赞 时 ， 则 可 把 弹 
蓉 中 人 径 作为 设计 常量 。 

3) 注意 独立 变量 和 相关 变量 。 独 立 变 量 是 指 仅 在 选 定 的 子 系统 边界 内 、 在 模 
型 中 可 独立 取得 的 变量 ， 它 不 受 子 系统 边界 外 的 影响 ， 也 不 影响 其 他 了 于 系统 的 性 能 
和 结构 。 当 把 总 系统 分 解 为 在 干 个 子 系统 来 分 别 进 行 优化 设计 时 ， 难 免 有 一 个 或 几 
个 变量 同时 包含 在 相 邻 子 系统 中 ， 这 种 变量 在 这 个 子 系统 中 的 最 优 值 在 相关 子 系统 
中 就 不 是 最 优 值 ， 把 有 这 种 特点 的 变量 称 为 相关 变量 。 

4) 应 尽量 选取 有 实际 意义 的 无 因 次 变量 作为 设计 变量 。 有 量 纲 的 参数 ， 当 取 
单位 不 同时 ， 其 值 的 大 小 发 生变 化 ， 将 导致 对 数学 模型 产生 不 同 的 影响 ， 这 对 优化 
结果 一 般 不 会 产生 影响 。 但 会 影响 计算 的 效率 ， 甚 至 导致 一 些 优 化 方法 失效 。 用 无 
量 纲 的 参数 作为 设计 变量 就 不 存在 这 一 问题 。 例 如 ,一 对 齿轮 传动 ， 大 小 齿轮 的 齿 


数 za 和 2 可 以 作为 设计 变量 ， 因 为 传动 比 i= 一 为 无 量 纲 的 量 ， 所 以 用 z 和 i 作为 


设计 变量 较 好 。 
1.2 约束 条 件 


优化 设计 不 仅 要 使 所 选择 方案 的 设计 指标 达到 最 优 值 ， 同 时 还 必须 满足 一 些 附 
加 的 条 件 ， 这 些 附加 的 设计 条 件 都 是 对 设计 变量 取 值 的 限制 ， 在 优化 设计 中 叫 作 设 
计 约 束 ， 它 的 表现 形式 有 两 种 。 一 种 是 不 等 式 约束 ， 即 
g.(X)<0 
或 2g,(X)=0 (uw=1,2,.…,m) 
男 一 种 是 等 式 约 束 ， 即 


































































































h (RR)=0 (v=1,2,.… ,p<n) 
式 中 ，g,( 兰 ) 和 有 hh,( 肝 ) 分 别 为 设计 变量 的 函数 ， 统 称 为 约束 消 数 ; m 和 p 分 别 表示 
不 等 式 约束 和 等 式 约束 的 个 数 ， 而 且 等 式 约 束 的 个 数 p 必须 小 于 设计 变量 的 个 数 
n。 因 为 从 理论 上 讲 存 在 一 个 等 式 约束 就 可 以 用 它 消去 一 个 设计 变量 ， 这 样 便 可 以 
降低 优化 设计 问题 的 维 数 。 
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根据 约束 的 性 质 不 同 ， 可 以 将 约束 分 为 区 域 约束 和 性 能 约束 两 类 。 区 域 约束 是 
直接 限定 设计 变量 取 值 范围 的 约束 条 件 ; 而 性 能 约束 是 由 茶 些 必须 满足 的 设计 性 能 
有 要求 推导 出 来 的 约束 条 件 。 在 求解 时 对 这 两 类 约束 有 时 不 同 对 符 。 

不 等 式 约束 及 其 有 关 概 念 在 优化 设计 中 是 相当 重要 的 。 每 一 个 不 等 式 约束 
都 把 设计 空间 划分 成 两 部 分 。 一 部 分 满足 该 不 等 式 约束 条 件 ， 另 一 部 分 则 不 满 
足 ， 两 部 分 的 分 界面 叫 作 约束 面 。 一 个 优化 设计 间 题 的 所 有 不 等 式 约束 的 边界 
将 组 成 一 个 复合 约束 边界 ， 复 合 边界 内 的 区 域 是 满足 所 有 不 等 式 约 束 条 件 的 部 
分 ， 在 这 个 区 域 中 所 选择 的 设计 变量 是 允许 采用 的 ， 这 个 区 域 称 为 设计 可 行 域 
或 简称 可 行 域 。 除 去 可 行 域 的 设计 空间 称 为 非 可 行 域 。 据 此 ， 可 行 域内 的 任何 
设计 点 都 代表 一 个 允许 采用 的 设计 方案 ,， 这样 的 点 叫 作 可 行 解 或 内 点 ， 在 约束 
边界 上 的 点 叫 作 极限 设计 点 或 边界 点 ， 此 时 这 个 边界 所 代表 的 约束 叫 作 适时 约 
束 或 起 作用 约束 。 

在 建立 数学 模型 时 ， 目 标 函 数 与 约束 阴 数 不 是 绝对 的 ; 对 于 同一 对 象 的 优化 设 
计 问 题 (如 齿轮 传动 优化 设计 )， 不 同 的 设计 要 求 ( 如 要 求 质量 最 轻 或 承载 能 力 大 
等 ) 反映 在 数学 模型 上 是 选择 不 同 的 目标 函数 和 约束 函数 ， 设 定 不 同 的 约束 边界 
值 。 换 言 之 ， 目 标 函 数 和 约束 函数 都 是 设计 问题 的 性 能 函数 ， 只 是 在 数学 模型 中 人 允 
许 不 同 的 角色 。 所 以 ,通常 的 做 法 是 将 日 标 浮 数 和 约束 函数 视 为 问题 函数 ， 建 立 起 
某 一 对 象 的 优化 设计 通用 数学 模型 ， 再 根据 具体 的 设计 要 求 ， 指 定 某 个 或 菜 些 问题 
国 数 为 目标 函数 ， 某 些 问题 冰 数 为 约束 函数 且 设 定 边 界 值 。 

当 优 化 数学 模型 中 的 问题 函数 均 为 设计 变量 的 线性 函数 时 ， 则 称 为 线性 规划 间 
题 。 问 题 函数 中 包含 非 线性 函数 时 ， 则 称 为 非 线 性 规划 问题 。 多 数 工程 优化 设计 问 
题 的 数学 模型 是 属于 有 约束 的 非 线 性 规划 问题 。 





















































1.3 目标 函数 和 等 值 线 


每 一 个 设计 问题 ， 和 都 有 一 个 或 多 个 设计 中 所 追求 的 目标 ， 它 们 可 以 用 设计 变量 
的 函数 来 加 以 描述 ， 在 优化 设计 中 称 它 们 为 目标 函数 ， 当 给 定 一 组 设计 变量 值 时 ， 
就 可 计算 出 相应 的 目标 函数 值 ， 因 此 ， 在 优化 设计 中 ， 就 是 用 目标 函数 值 的 大 小 来 
衡量 设计 方案 的 优 劣 。 优 化 设计 的 目的 束 是 要 求 所 选择 的 设计 变量 使 目标 函数 值 达 
到 最 优 值 。 最 优 值 可 能 是 极 大 值 ， 也 可 能 是 极 小 值 ， 由 于 求 目 标 函 数 , 拟 瑟 ) 的 极 大 
值 等 价 于 求 目 标 函 数 -所 层 ) 的 极 小 值 ， 因 此 ， 为 了 算法 和 程序 的 统一 ， 通 第 最 优 
化 就 是 指 极 小 值 A 半 ) 一 min。 

在 工程 设计 问题 中 ,设计 所 妃 求 的 目标 可 能 是 各 式 各 样 的 ， 当 目标 水 数 只 包含 
一 项 设计 指标 极 小 化 时 ， 称 为 单 目 标 设计 问题 。 当 目标 函数 包含 多 项 设计 指标 极 小 
化 时 ， 这 就 是 所 谓 的 多 目标 设计 问题 。 单 目标 优化 设计 问题 由 于 指标 单一 ， 易 于 衡 
量 设计 方案 的 优 劣 ， 求 解 过 程 比 较 简 单 明 确 ， 而 多 目标 问题 则 比较 复杂 ， 多 个 指标 
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往往 构成 了 矛 慎 ， 很 难 或 者 不 可 能 同时 达到 极 小 值 。 多 上 日 标 问题 的 求解 较为 简单 的 方 
法 是 采用 线性 加 权 的 形式 ， 将 多 目标 问题 转化 为 单 目 标 问题 求解 。 或 将 一 些 目 标 转 
化 为 约束 函数 ， 这 样 处 理 后 的 数学 模型 往往 不 能 很 好 地 体现 多 目标 问题 的 实质 。 求 
得 的 最 优 解 不 能 很 好 地 满足 设计 要 求 。 

由 于 目标 函数 是 设计 变量 的 函数 。 故 给 定 一 组 设计 变量 ， 就 相应 有 一 个 孙 数 
值 。 并 在 设计 空间 相应 有 个 设计 点 ， 因 此 也 可 以 次 设计 空间 任何 一 点 都 有 一 个 末 数 
值 与 之 相对 应 。 具 有 相同 函数 值 的 点 集 在 设计 空间 形成 一 个 曲面 或 曲线 ， 称 为 目标 
呐 数 的 等 值 面 或 等 值 线 。 


1.4 ”优化 设计 的 数学 模型 


优化 设计 的 数学 模型 由 设计 变量 、 目 标 也 数 和 约束 条 件 三 部 分 组 成 ， 可 写成 以 
下 全 化 式 : 





























求 变 量 : NX] ,N,N 
使 极 小 化 函数 : FR )X2 i 
满足 约束 条 件 : 


g, (Xi, N,N,) 0 (w=1,2,.…,m) 
h(xi,x,,X,) =0 (v=1,2,.…,p,p <n) 
其 中 g,(%i ,xs，…,%,) 反 0 称 为 不 等 式 约束 条 件 ,，h,(xi xx) =0 称 为 等 式 
约束 条 件 。 
用 向 量 和 = (x ,x,,…,%,) ”表示 设计 变量 ,Xe R" 表示 向 量 对 属于 n 维 欧 氏 空 
间 ， 用 min 、max 表示 极 小 化 和 极 大 化 ，s. t. 表示 “满足 于 ”，m 和 pp 分别 表示 不 
等 式 约束 和 等 式 约束 的 个 数 。 数 学 模型 可 写成 以 下 向 量 形式 .: 
minf(X) (XeR") 


ste (XN, )<0O (uu=1,2,.…,m) 











h, (xi,X2 Mao) =0 (v=1,2,.%,p,p<n) 
由 于 工程 设计 的 解 一 般 都 是 实数 解 ， 故 可 省 略 症 e R"， 将 优化 设计 的 数学 模型 
简 记 为 
minf( X¥) 
s.t.g, (Xi,X ,7X,) 0 (uu=1,2,.…,m) 
h, (xi,X2 Ma) =0 (v=1,2,.%,p,p<n) 

当 设 计 问 题 要 求 极 大 化 目标 函数 /( 半 ) 时 ， 只 需要 将 目标 孔 数 改写 为 -f/( 站 ) 即 
可 ， 这 是 因为 max 帮 下 ) 和 minl -大 和 ) ] 具 有 相同 的 解 。 同 样 ， 当 不 等 式 约 束 条 件 中 
的 不 等 号 为 “=0” 时 ， 只 要 将 不 等 式 两 端 同 乘 以 “”-17” ， 即 可 得 到 “和 0” 的 一 
般 形 式 。 

最 优化 问题 也 称 为 数学 规划 问题 ， 最 优化 问题 根据 数学 模型 中 是 否 包 含 约束 条 
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件 而 分 为 无 约束 优化 问题 和 约束 优化 问题 ; 根据 设计 变量 的 多 少 可 分 为 单 变 量 优化 
问题 和 多 变量 优化 问题 ; 根据 目标 函数 和 约束 函数 的 性 质 可 分 为 线性 规划 问题 和 非 
线性 规划 问题 。 

当 数学 模型 中 的 目标 函数 均 为 设计 变量 的 线性 函数 时 ， 称 此 设计 问题 为 线性 优 
化 问题 或 线性 规划 问题 。 当 目标 函数 和 约束 函数 中 至 少 有 一 个 为 非 线性 函数 时 ， 称 
此 设计 问题 为 非 线性 优化 问题 或 非 线 性 规划 问题 。 

线性 规划 和 非 线 性 规划 是 数学 规划 的 两 个 重要 分 文 。 生 产 计 划 和 经 济 管理 方面 
的 问题 一 般 属 于 线性 规划 问题 ， 而 工程 设计 问题 则 属于 非 线 性 规划 问题 。 








第 2 半 优化 设计 的 理论 基础 


2.1 优化 设计 问题 的 几何 意 》 


2.1.1 目标 函数 的 等 值 面 ( 线 ) 


目标 函数 的 值 是 评价 设计 方案 优 劣 的 指标 。n 维 变 量 的 目标 哨 数 ， 其 函数 图 像 
只 能 在 n+1 维 空间 中 描述 出 来 。 当 给 定 一 个 设计 方案 ， 即 给 定 一 组 zi ，x,，…， 
x 的 值 时 ， 目 标 函 数 太 站) = 了 zi ,xo，… ,x ) 必 相应 有 一 确定 的 函数 值 ; 但 奢 给 定 一 
个 作 XX) 值 ， 却 有 无 限 多 组 x; ，x,，…,% 值 与 之 对 应 ， 也 就 是 当 f( 半 ) = a 时 ， 
下 = (xwi,%s，…,%。) 在 设计 空间 中 对 应 有 一 个 点 集 。 通 常 这 个 点 集 是 一 个 曲面 〈 二 
维 是 有 曲线， 大 于 三 维 称 为 曲面 )， 称 之 为 目标 函数 的 等 值 面 。 当 给 定 一 系列 的 a 
值 , 取 a=a;，a,，… 时 ， 相 应 地 有 碎 半 ) =w ，w，…， 这 样 可 以 得 到 一 组 超 曲 面 
族 一 一 等 值 面 族 。 显 然 ， 等 值 面具 有 下 述 特性 ， 即 在 一 个 特定 的 等 值 面 上 ， 尺 管 设 
计 方 案 很 多 ,但 每 一 个 设计 方案 的 目标 函数 值 却 是 相等 的 。 

现 以 二 维 无 约束 最 优化 设计 间 题 为 例 曾 明 其 几何 意义 。 如 图 2-1 所 示 ， 二 维 目 
标 函 数值 儿科 ) =fxi ,x ) 在 以 x!、xs 入 站 ) 为 坐标 的 三 维 坐 标 系 空间 内 是 一 个 曲 
面 。 在 二 维 设计 平面 x,0x, 中 ， 每 一 个 点 站 = 22 ) 都 有 一 个 相应 的 目标 函数 值 
所 针 ) =f(xi ,x)， 它 在 图 中 反映 为 沿 作 X) 轴 方 回 的 高 度 。 奋 将 A( 和 站 ) = 了 (Xi,*%,) 面 
上 具有 相同 高 度 的 点 投影 到 设计 平面 x,0x, 上 ， 则 得 .AXE) = 了 (wi ,xs) =a 的 点 集 ， 
称 为 目标 函数 的 等 值 线 〈 等 值 线 是 等 值 面 在 二 维 设计 空间 中 的 特定 形态 ) 。 当 给 定 
一 系列 不 同 的 a 值 时 ， 可 以 得 到 一 组 平面 曲线 : 太 下 ) = za ) = ai, 帮 下 ) = 
xi) =a,，…， 这 组 曲线 构成 目标 函数 的 等 值 线 族 。 由 图 可 以 清楚 地 看 到 ， 等 
值 线 的 分 布 情况 反映 了 目标 函数 值 的 变化 情况 ， 等 值 线 越 问 里 ， 目 标 枉 数值 越 小 ， 
对 于 一 个 有 中 心 的 曲线 族 来 说 ,目标 函数 的 无 约束 极 小 点 就 是 等 值 线 族 的 一 个 共同 
中 心 半 ” 。 故 从 几何 意义 上 说 ， 求 目标 函数 无 约束 极 小 点 也 就 是 求 其 等 值 线 族 的 共 
同 中 心 。 

以 上 二 维 设计 空间 等 值 线 的 讨论 ， 可 以 推广 到 分 析 多 组 问题 。 但 需 注意 ， 对 于 
三 维 问题 在 设计 空间 中 是 等 值 面 ， 高 于 三 维 的 问题 在 设计 空间 中 则 是 等 值 超 曲面 。 


2.1.2 约束 最 优 解 和 无 约束 最 优 解 
n 维 目标 函数 所 ZE) =f(xi ,xs，,…,%,)， 若 在 无 约束 条 件 下 极 小 化 ， 即 在 整个 n 
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维 设计 空间 寻找 筷 ” = (x? ,人 xy )"， 使 满足 minf( 站 ) = 成 下 ) ,下 ER"， 其 最 优 
点 对 " 、 最 优 值 /(X“ ) 构 成 无 约束 最 优 解 ， 若 在 约束 条 件 限制 下 极 小 化 ， 即 在 可 行 
域 中 寻找 对 ”= (x? ,x2 ,… ,x ) 使 满足 minf (站) =/(X"),， 站 eR"， 其 最 优点 
XX 、 最 优 值 /(X" ) 构成 约束 最 优 解 ， 无 论 在 数学 模型 还 是 几何 意义 上 ， 两 者 均 是 
不 同 的 概念 。 

现 用 一 个 二 维 非 线 性 最 优化 问题 ， 从 几何 意义 上 来 说 明 约 束 最 优 解 和 无 约束 最 
优 解 。 

设 已 知 目标 函数 f( 站 ) SW + X 一 人 和 +4， 受 约束 于 gi (了 站) 二 XI 一 X» + 之 访 0 
2 (在 ) =2%1 三 0 ， 83( 半 ) =2%2 三 0,84 (在 ) 三 一 2 +2%2 一 [三 0， 求 其 最 优 解 于 -和 大) 。 
图 2-1a 表示 其 目标 函数 和 约束 函数 的 立体 图 ， 图 2-1b 表示 其 平面 图 。 当 目标 函数 
f( 下 ) =0.25、1、4、6.25 时 ， 相 应 在 x10 x, 设 计 平面 内 得 一 系列 平面 曲线 (同心 
圆 ) 一 一 等 值 线 ， 它 表示 了 目标 函数 值 的 变化 情况 ， 越 向 里 边 的 代表 目标 函数 值 
越 小 。 显 然 其 无 约束 最 优 解 为 目标 函数 等 值 线 同心 圆 中 心 X "Y= (zx )， 
= (2,0) ,A(X*') =0。 而 其 约束 最 优 解 则 需 在 由 约束 线 g1 (和 ) =0，g, (下) =0， 
g3( 尺 ) =0，gs( 耻 ) =0 组 成 的 可 行 域 (阴影 线 里 侧 ) 内 寻找 使 目标 函数 值 为 最 小 的 
点 ， 由 图 可 见 ， 约 东 线 g&,(X) =0 与 某 等 值 线 的 一 个 切 点 于" 即 为 所 求 ，XX*' = 
(0) =(0.58,1.34) ， 帮 2 ) =3.8 为 其 约束 最 优 解 。 


















































a) b) 


图 2-1 二 维 函 数 的 约束 最 优 解 和 无 约束 最 优 解 


以 上 二 维 问题 关于 约束 最 优 解 和 无 约束 最 优 解 几何 意义 的 讨论 ， 同 样 可 以 推广 
到 多 维 问 题 。n 个 设计 变量 (xi ,x,,…,%, ) 组 成 设计 空间 。 在 这 个 空间 中 的 每 个 点 代 
表 一 个 设计 方案 。 此 时 个 变量 有 确定 的 值 。 当 给 定 目 标 函 数 某 一 值 时 ， 束 在 n 维 
设计 空间 内 构成 一 个 目标 函数 的 等 值 超 曲 面 ， 给 定 目 标 函 数 一 系 列 数 值 时 束 得 一 系 
列 目标 函数 的 等 值 超 曲 面 。 这 些 等 值 超 曲 面 反 映 了 目标 函数 的 变化 情况 。 无 约束 最 
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优点 为 这 些 等 值 超 曲面 的 共同 中 心 。 对 于 约束 最 优化 问题 ， 每 一 个 约束 条 件 在 并 维 
设计 空间 中 是 一 个 约束 超 曲面 ， 全 部 约束 超 曲面 在 设计 空间 中 构成 可 行 域 。 在 其 上 
寻找 目标 郧 数值 最 小 的 点 即 为 约束 最 优点 。 这 一 点 可 以 是 目标 函数 等 值 超 曲面 与 某 
个 约束 超 曲 面 的 一 个 切 点 ， 也 可 以 是 目标 函数 值 较 小 的 某 些 约束 超 曲面 的 交点 
(如 图 22 所 示 的 下 "点 ) 。 























图 22 nn 维 问 题 的 约束 最 优点 和 无 约束 最 优点 


2.1.3 局 部 最 优 解 和 全 域 最 优 解 


对 无 约束 最 优化 问题 ， 当 目标 函数 不 是 单 峰 函数 时 ， 有 多 个 极 值 点 XX ， 
"中 ，…， 如 图 2-3 所 示 。 此 时 ， 着” 和 A/(X* )、 关 "和 f(X*%W ) 均 称 为 局 部 
最 优 解 。 如 其 中 "的 目标 函数 值 {(X"“ ) 是 全 区 域 中 所 有 局 部 最 优 解 中 的 最 小 
者 ， 则 称 对 "和 f/( 半 "n ) 为 全 域 最 优 解 。 

对 于 约束 最 优化 问题 ， 人 情况 更 为 
复杂 ， 它 不 仪 与 目标 限 数 的 性 质 有 
关 ， 还 与 约束 条 件 及 其 函数 性 质 有 
关 。 如 图 2-4 所 示 ， 将 目标 呆 数 所 已 ) 
的 等 值 线 绘 于 图 上 ， 由 两 个 不 等 式 约 
束 g1 (对 ) 二 0、g, (站) 三 0 构成 两 个 可 
行 域 D, 和 D,。 头 "“ 、 天 "人 、 下 "分 
别 是 可 行 域 内 在 某 一 邻 域 目 标 孔 数值 
最 小 的 点 ， 都 是 局 部 极 小 点 ， 亦 即 
RE 图 2.3 ”无 约束 优化 的 全 域 和 局 部 最 优 解 
和 "路 、f(X*%) 均 称 为 局 部 最 优 解 。 

由 于 /XX 中) <f(X* 人 中) <A(X*)， 可 知人 "为 全 域 极 小 点 ， 亦 即 了 "和 
f(X*% ) 为 全 域 最 优 解 。 

优化 设计 总 是 期 望 得 到 全 域 最 优 解 ， 但 目前 的 优化 方法 只 能 求 出 局 部 最 优 解 ， 

并 采取 对 各 局 部 最 优 解 的 函数 值 加 以 比较 ， 取 其 中 最 小 的 一 个 作为 全 域 最 优 解 。 
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图 2-4 约束 优化 的 全 域 和 局 部 最 优 解 
2.2 无 约束 目标 函数 的 极 值 点 存在 条 件 


2.2.1 函数 的 极 值 与 极 值 点 


以 一 元 函数 为 例 说 明 函 数 的 极 值 与 极 值 点 。 图 2-5 所 示 为 定义 在 区 间 [a,b] 上 
的 一 元 函数 f(x)。 

图 上 有 两 个 特殊 点 x 与 x 在 jo 
* 附近， 子 数 f(x) 恒 以 f(x ) 为 最 
大 ; 在 x” 附 近 ， 函 数值 以 f(x ) 为 
最 小 。 因 此 x 与 x” 即 为 函数 的 极 大 
上 与 极 小 点 ， 统 称 为 函数 f(x) 的 极 值 
点 。 需 要 注意 ， 这 里 所 谓 的 极 值 是 相 
对 于 一 点 的 附近 邻 域 各 点 而 言 的 ， 仅 
具有 局 部 的 性 质 ， 所 以 这 种 极 值 又 称 
为 局 部 极 值 ， 而 函数 的 最 大 值 与 最 小 
值 是 对 整个 区 间 而 言 的 。 如 图 2 中 图 2.5 ”函数 的 极 值 与 极 值 点 
函数 的 最 大 值 为 1 5)， 函 数 的 最 小 值 
为 a) 。 函 数 的 极 值 并 不 一 定 是 最 大 值 或 最 小 值 。 


2. 2. 2 ” 极 值 点 存在 的 条 件 


1. 一 元 函数 即 单 变 量 函 数 ) 的 情况 
(1) 极 值 点 存在 的 必要 条 件 ”我 们 在 高 等 数学 中 已 经 学 过 : 如 有 果 函 数 作 x%) 的 
一 阶 导数 (x) 存 在 的 话 ， 则 欲 使 x I 件 为 
f(x ) = (231) 
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仍 以 图 2-5 中 所 示 一 元 函数 为 例 ， 由 图 可 见 ， 在 x 与 2 处 的 斜率 均等 于 零 ， 即 
函数 在 该 两 点 处 的 切线 与 * 轴 平 行 。 但 使 f(x* ) =0 的 点 并 不 一 定 都 是 极 值 点 ， 如 图 
中 的 x 中 点 ， 昌 然 1'(x”) =0, 但 并 非 极 值 点 而 为 一 驻 点 。 使 函数 f(x) 的 一 阶 导数 
了 (x* ) =0 的 点 称 为 函数 A(x) 的 驻 点 。 极 值 点 (对 存在 导数 的 函数 ) 必 为 驻 点 ， 但 驻 
点 不 一 定 是 极 值 点 。 至 于 驻 点 是 否 为 极 值 点 可 以 通过 二 阶 导数 (x) 来 判断 。 











(2) 极 值 点 存在 的 充分 条 件 ” 硅 在 驻 点 附近 ， 有 


f° (x) <0 (22) 
则 该 点 为 极 大 点 ; 
藻 在 驻 点 附近 ， 有 
f°(x) >0 
则 该 点 为 极 小 点 。 


(23) 
在 图 2-5 中 的 x 附近， 其 右 侧 六 (x) <0， 但 其 左 侧 户 (*) >0， 因 此 它 不 是 一 
个 极 值 点 。 可 见 函 数 二 阶 导 数 的 符号 成 为 判断 极 值 点 的 充分 条 件 。 
2. 多 元 函数 ( 即 多 变量 函数 ) 的 情况 


设 /(x) 为 定义 在 XeDCR" 中 的 n 元 函数 。 向 量 XX 的 分 量 x ，x， 
函数 的 自 变 量 


变量 。 设 站” 为 定义 域内 的 一 个 点 ， 量 在 该 点 有 连续 的 n+1 阶 偏 导数 ， 
则 在 该 点 附近 可 用 泰勒 级 数 展开 ， 如 取 到 二 次 项 ， 有 

a < 0 a 本 
/A(X) =/(X )+ > 3 [人 7 2 O10 %) (5 一 和 ) (x; 1 ) 


如 打 用 癌 量 矩阵 形式 表示 ， 则 式 (2-4) 可 写 为 











(C24) 
Ni = 
(k) 
SX”) HK) FX) -% 
对 ) 二" | ee | 
0 i 
i 
pa —x1® A -x2 ，" -x ) 、 
A. 2 of(X'™) a (2-5) 
OX] OX] Ox] OX» OX1OX ， 
by = 
ofX™) ofX™) GEA. 0 3 
Ox gwi Ox gw， Ox OX, 
: : ; 二 
RX) FX) of(X™) 
OX, OX] 


OX, OX» OX, OX, 
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可 简写 为 
fCX) EAX +E VX )] (XK-X™)+ 
5X-XH)" VAXY) (于 -和 0) (2-6) 
式 中 ， 
HX) 
O XI 
A(X ) 
J | 
Ws -| Ox ” Ox ” ?Ox%, 2 
HX) 
OX, 
ofX™) OK ) ~ IfX™) 
0 XIO XI 0 X10 X» 0 X10 %, 
OX HEY .NE ) 
V/(X™”)=H(X")=| OX%0% 0%0%, O X30, (2-8) 


AX) HAY RE) 
0 XO Xl OX,O NX, 0 Xi,O XN, 
VA(X" ) 是 函数 A(X) 在 XX” 点 的 一 阶 偏 导数 矩阵 ， 称 为 函数 在 该 点 的 梯度 。 
梯度 W(X ) 是 一 个 向 量 ， 其 方向 是 函数 A() 在 ”点 数值 增长 最 快 的 方向 ， 亦 
即 负 梯 度 - V(X" )。 方向 是 函数 A 作对) 在 X ”点 数值 下 降 最 快 的 方向 ， 梯 度 的 模 


4 (k) 2 
| Wx®) = /A )) 


交 一 


但 需 注意 ， 函 数 A( 站 ) 在 某 点 对 ”的 梯度 。 ma roo 等 值 线 族 
向 量 W(X" ) 仅 仅 反 映 f(X) 在 对” 点 附近 极 
小 邻 域 的 性 质 ， 因 而 它 是 一 种 局 部 性 质 。 郴 
数 在 定义 域内 的 各 点 都 各 和 目 对 应 着 一 个 确定 
的 梯度 。 此 外 ， 函 数 /( 半 ) 在 ”点 的 梯度 向 
量 VX" ) 正 是 函数 等 值 线 或 等 值 超 曲 面 在 
该 点 的 法 问 量 。 图 2-6 表示 二 元 函数 1( 了 对) 在 
和 、X 点 的 梯度 WX' )、WX'”) 和 人 负 
梯度 - VE) 、- WX )。VfA(X") 是 。 图 2-6 二 元 函数 的 梯度 和 负 梯 度 
函数 扰 苇 ) 在 对” 点 的 二 阶 偏 导数 组 成 的 nxn 
阶 对 称 和 矩阵 ， 或 称 为 1 对 ) 的 黑 塞 (Hessian) 矩阵 , 记 H(X")。 

式 (2-4) ~ 式 (2-6) 只 取 到 泰勒 级 数 二 次 项 ， 称 为 函数 的 二 次 近似 表达 式 。 


























VCKO)) | 
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(1) 极 值 点 存在 的 必要 条 件 nn 元 函数 在 定义 域内 极 值 点 存在 的 必要 条 件 为 
(AK) KE ) XY 
WS ja OX! ? 0x, ” ”0x， ] = 
即 对 每 一 个 变量 的 一 阶 偏 导数 值 必须 为 零 ， 或 者 说 梯度 为 零 (n 维 零 向 量 ) 。 
和 一 元 函数 对 应 ， 满 足 式 (2.9) 只 是 多 元 函数 极 值 点 存在 的 必要 条 件 ， 而 并 
非 充 分 条 件 ， 满 足 W(X* ) =0 的 点 X" 称 为 驻 点 ， 至 于 驻 点 是 否 为 极 值 点 ， 尚 需 
通过 二 阶 偏 导 数 矩 阵 来 判断 。 
(2) 极 值 点 存在 的 充分 条 件 “如何 判断 多 元 函数 的 一 个 驻 点 是 否 为 极 值 点 呢 ? 
将 多 元 函数 /(X) 在 驻 点 X" 附近 用 泰勒 公式 的 二 次 近似 式 来 表示 ， 则 由 式 
(2-6) 得 
AX) SAK) +[ VX) (RX) + XR-X)HX)(X-X") 
因为 X" 为 驻 点 ，W(X" ) =0， 于 是 有 
AX) -AX)~3 (XK) HX) (XX") 


在 ”点 附近 的 邻 域 内 ， 奉 对 一 切 的 对 恒 有 
AX) -AX )>0 





(2-9) 











亦 即 

(KX-X*) H(X*)(X-X*)>0 (2-10) 
则 于 ”为 极 小 点 ; 否则 ， 当 恒 有 

(X= (X00 (之 二 | 


时 ， 则 和 为 极 大 点 。 
根据 矩阵 理论 知 ， 由 式 (2-10)、 式 (2-11) ， 得 极 小 点 的 充分 条 件 为 


n 


> 人 0 (2 


亦 即 驻 点 黑 塞 矩 阵 如 (于 ”) 必须 为 正定 。 同 理 知 极 大 点 的 充分 条 件 为 


n 


2, A Ce (2-13) 


亦 即 驻 点 墨 塞 矩 阵 五 (X” ) 必须 为 负 定 。 而 当 


n 


> OFX ) — x ) (x a _ 0 (2-14) 


SE 0X0 %; 
亦 即 驻 点 黑 塞 和 矩 阵 五 (站) 既 非 正定 ， 叉 非 负 定 ， 而 是 不 定 ,，f( 半 ) 在 于” 处 无 
极 值 。 
至 于 对 称 和 矩阵 正定 、 负 定 的 检验 ， 由 线性 代数 可 知 ， 对 称 和 矩阵 


Ql QW12 Cln 
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正定 的 条 件 是 它 的 行列 式 1 41 的 顺序 主子 式 全 部 大 于 零 ， 即 

















Ql1 QW12 Cin 
a a a a vss, “05, 
TE | “| >0 (OS 
C21 (22 : ” 
Ql Qn 让 Qn 
负 定 的 条 件 是 它 的 行列 式 141 中 一 串 主 子 式 为 相间 的 一 负 一 正 ， 即 
CI CD ”CQ 
a a a a Ws 
| | >0 (2-16 ) 
21 022 : 。 : 
Ql Qi Se CQ 











至 此 ， 读 者 完全 不 难 自行 归纳 得 出 无 约束 目标 函数 极 值 点 存在 的 充分 必要 条 件 
和 用 数学 分 析 作 为 工具 对 n 维 无 约束 优化 问题 寻求 最 优 解 。 


2.3 ”函数 的 凸 性 





由 前 述 讨 论 可 知 ， 函 数 的 最 优 值 与 极 值 是 有 区 别 的 。 前 者 是 指 全 域 而 言 ， 而 后 
者 仅 为 局 部 的 性 质 。 一 般 来 说 ， 在 函数 定义 的 区 域内 部 ， 最 优点 必 是 极 值 点 ， 反 之 
却 不 一 定 。 如 果 能 得 到 两 者 等 同 条 件 ， 就 可 以 用 求 极 值 的 方法 来 求 最 优 值 ， 因 此 对 
于 函数 的 最 优 值 与 极 值 之 间 的 关系 需 做 进一步 的 讨论 。 目 标 函 数 的 凸 性 与 所 需 讨 论 
的 问题 有 密切 的 关系 。 

我 们 可 以 先 用 一 元 函数 来 说 明 函 数 的 是 性。 如 图 27 所 示 ， 图 2-7a 中 在 
(x 路 ， x2 了) 区 间 上 曲线 是 下 凸 的 ， 图 2-7b 的 曲线 是 上 凸 的 ， 它 们 的 极 值 点 ( 极 
小 点 或 极 大 点 ) 在 区 间 内 都 是 唯一 的 。 这 样 的 函数 称 为 具有 同性 的 函数 ， 或 称 为 
单 峰 函 数 。 

















图 2-7 ”也 数 的 四 是 性 定义 
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2.3.1 凸 集 与 非 凸 集 


为 了 考虑 多 元 函数 的 是 性 ， 首 先 要 说 明 函 数 定义 域 应 具有 的 性 态 

设 D 为 n 维 欧 氏 空间 中 设计 点 站 的 一 个 集合 ， 若 其 中 任意 两 点 Xo 和 XC) 的 连 
线 都 在 集合 D 中 ， 则 称 这 种 集合 是 n 维 欧 氏 空 间 的 一 个 是 集 。 二 维 函 数 的 情况 如 
图 2-8 所 示 ， 其 中 图 2-8a 所 示 为 凸 集 ， 网 2-8b 所 示 为 非 凸 集 。 


X2 X2 








a) b) 


图 2-8 函数 定义 域 的 性 态 


在 nn 维 空间 中 ， 若 对 某 集合 D 内 的 任意 两 点 X'" 与 X'“ 作 连 线 ， 使 连 线 上 的 各 
个 内 点 对 任何 实数 a(0<a=1) 恒 有 
=a¥X +(1-a)X YeD Coa 
则 称 D 为 凸 集 。 图 2-9 所 示 是 对 于 二 维 问题 、 式 (2-17) 对 应 的 癌 量 图 解 。 
n 维 无 约束 最 优化 问题 的 整个 设计 空间 了 "是 凸 集 。 


Se 








x® 






0O Xl 


图 2-9 二 维 函 数 定义 域 凸 性 定义 图 解 


2.3.2 上 辐 函数 的 定义 


设 A() 为 定义 在 n 维 欧 氏 空间 中 一 个 凸 集 D 上 的 函数 ， 车 对 任何 实数 (0=< 
E 三 1) 及 万 域 中 任意 两 点 站 ”与 X 存在 如 下 关系 : 

f(EX + (1 -EX )SEAX ) +(1 -Ef X™) (2-18) 
则 称 函 数 /(X) 是 定义 在 凸 集 D 上 的 一 个 是 函数 。 现 用 图 2-10 所 示 定 义 于 区 间 
[a,5] 上 的 单 变量 函数 来 说 明 这 一 概念 。 若 连接 函数 曲线 上 任意 两 点 的 直线 段 ， 某 
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一 点 x 的 函数 值 恒 低 于 此 直线 段 上 相应 ya 
的 纵 坐 标 值 ， 则 这 种 函数 就 是 是 孙 数 ， 
也 就 是 单 峰 水 数 。 

在 将 式 〈2-18) 中 的 符号 “<” 改 
为 “<”， 则 称 函数 A 作 竺 ) 为 严格 是 函数 。 
右 将 式 (2-18) 中 的 符号 “ 近 ” 改 为 






f [Ex D+-é)x 


Ef CVI Of 


f°)) 
“三 ”， 则 如 图 2-7b 所 示 ， 国 数 曲 线 上 后 
(有 极 大 点 )， 通常 称 为 由 也 数 。 显 然 ， 0 0) 0 5 
奉 f%) 为 凸 函数， 则 一 fx) 为 四 函数 。 图 2-10” 凸 函 数 的 定义 


2.3.3 ” 凸 函 数 的 基本 性 质 


1) 奎 函数 (站 ) 和 ( 半 ) 为 是 集 D 上 的 两 个 凸 隙 数 ， 对 任意 正 数 a 和 4b， 也 数 
A 作 XX) =afi( 和 ) +5 有 (站 ) 仍 为 D 集 上 的 凸 函 数 。 

2) 若 人 "与 XX” 为 凸 函 数 作 对) 中 的 两 个 最 小 点 ， 则 其 连 线 上 的 一 切 点 也 都 是 
A 作 ) 的 最 小 点 。 

证 明 略 。 


2.3.4 吓 函 数 的 判定 


判别 法 1: 奎 函数 放下 ) 在 D1, 上 具有 连续 一 阶 导数 ， 而 D 为 D1 内 部 的 一 个 凸 集 ， 

则 fA( 对 ) 为 D 上 的 凸 函数 的 充分 必要 条 件 为 : 对 任意 的 X'"",，X'”eD 恒 有 
XIEXIE(R ==) WX ) (2-19) 

判别 法 2: 硅 函 数 信 站) 在 凸 集 D 上 存在 二 阶 导数 并 有 旦 连续 ,，f( 半 ) 在 DD 上 为 凸 
消 数 的 充分 必要 条 件 为 : 对 于 任意 的 了 eD，f() 的 黑 塞 算 阵 五 (站 ) 处 处 是 正 半 定 
矩阵 。 

硅 黑 塞 矩 阵 玉 (站 ) 对 一 切 和 站 eD 痢 是 正定 的 ， 则 Af) 是 D 上 的 严格 凸 函数 ， 
反之 不 一 定 成 立 。 

例 2-1 判别 函数 fA) =50 -10x -4x,+xi?+x? -2 在 万 = 1 和 | -oo <x < 
+% (IT=1,2)} 上 是 否 为 凸 冰 数 。 

解 : 利用 黑 塞 和 矩阵 来 判别 : 











of(X) of(X) 








O XI XI O XX, 2 “1 
H(X) A= -| 
of(X) of(\X) -1 2 
O XX] O XX, 
Ql 21 2 =] 
Oa SZ 0 = =3>0 
Q51 0 —1] 2 











因此 黑 禾 和 矩阵 是 正定 的 ， 故 f 作 站) 为 严格 凸 函数。 


16 机 械 优化 设计 与 实例 


2.3.5 了 通 数 的 凸 性 与 局 部 极 值 及 全 域 最 优 值 之 间 的 关系 


设 狼 外) 为 定义 在 凸 集 D 上 的 一 个 函数 ， 一般 来 说 ,，f( 兰 ) 的 极 值 点 不 一 定 是 它 
的 最 优点 。 但 是 ， 奉 信和 ) 为 凸 集 DD 上 的 一 个 凸 函数 ， 则 所 站) 的 任何 极 值 点 ， 同 时 
也 是 它 的 最 优点 。 硅 儿 站 ) 还 是 严格 是 疯 数 ， 则 它 有 唯一 的 最 优点 。 


2.4 ”约束 极 值 点 存在 条 件 











2.4.1 ”等 式 约束 优化 问题 极 值 点 存在 条 件 


求解 等 式 约束 优化 问题 : 
minf( X¥) 
s.t.h,(X)=0 (k=1,2,.…,m) 
需要 导出 极 值 存在 的 条 件 ， 这 是 求解 等 式 约束 优化 问题 的 理论 基础 。 对 这 一 间 
题 在 数学 上 有 两 种 处 理 方法 : 消 元 法 ( 降 维 法 ) 和 拉 格 天 日 乘 子 法 ( 升 维 法 )， 现 
分 别 予 以 介绍 。 
1. 消 元 法 
为 了 便于 理解 ， 先 讨论 二 元 函数 只 有 一 个 等 式 约束 的 简单 情况 ， 即 
minf( xi ,xX, ) 
s.t.h(xi,x,) =0 
根据 等 式 约束 条 件 将 一 个 变量 x 表示 成 为 一 个 变量 x, 的 函数 关系 x1 = 9 (%,)， 
然后 将 这 一 函数 关系 代入 到 目标 函数 放 xi ,x,) 中 消去 x;， 变 成 一 元 函数 (xs)， 从 
而 将 等 式 约束 优化 问题 转化 成 无 约束 优化 问题 。 目 标 函 数 通 过 消 元 由 二 元 函数 变 成 
对 并 维 情况 











minf( xi ,XXX ) 
Sh (0 (hs 2 
由 L 个 约束 方程 将 nn 个 变量 中 的 前 7 个 变量 用 其 余 n -i 个 变量 表示 ， 即 有 
Xi = PI1( X41 12 Mn ) 


2 三 AI1+2 9" 2 


人 
将 这 些 函 数 关 系 代入 到 目标 孔 数 中 ， 从 而 得 到 只 会 ,Xi2，…，% 共 nn-!l 
个 变量 的 函数 ， 这 样 就 可 以 利用 无 约束 优化 问题 的 极 值 条 件 求解 。 
消 元 法 虽然 看 起 来 简单 ， 但 是 实际 求解 困难 却 很 大 。 因 为 将 /个 约束 方程 联 立 
往往 求 不 出 解 来 。 即 使 能 求 出 解 ， 当 把 它们 代入 目标 函数 之 后 ， 也 会 因为 函数 十 分 
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复杂 而 难以 处 理 。 所 以 ， 以 这 种 方法 作为 一 种 分 析 方 法 实用 意义 不 大 ， 而 对 某 些 数 
值 迭代 方法 来 说 ， 却 有 很 大 的 启发 意义 。 
2. 拉 格 朗 日 乘 子 法 
拉 格 明日 乘 子 法 是 求解 等 式 约 束 优化 问题 的 另 一 种 经 典 方法 ， 它 是 通过 增加 变 
量 将 约束 优化 问题 变 成 无 约束 优化 问题 ， 所 以 又 称 作 升 维 法 。 
对 于 具有 /个 等 式 约束 的 维 优化 问题 
minf( X¥) 
eh 








在 极 值 点 站 "处 有 
VX) = $Me = WK) dK =0 
dh,(X*) = > Sa = Vh, (X*) d=0 (k=1,2,.…,7) 
把 1 个 等 式 约束 给 出 的 1 个 > Cd = 0 ， 分 别 乘 以 待定 系数 改 ( 上 =1,2,…,1) 再 


和 > a, = 0 相 加 ,得 


0 oh, oh, oh 
> sh 0 (2-20) 
可 以 通过 其 中 的 1 个 方程 
Oh, Oh, 
i tA tA 0 (2-21 ) 


OX 
来 求解 1 个 A， 人 >， 2 Al, a es dx, ， 3 ， dx 的 系数 全 
为 0， 这样 ， 式 (2-20) 的 等 号 左边 就 只 ( 刹 下 记 1 个 变量 的 微分 dx, ，，dxis，…， 
dx 的 项 ， 即 它 变 成 


oh, Oh, 
ed (222) 
j=l+1 Ox Ox OX; Ox 
但 dx,,,， Db 人 应 是 任意 量 ， 则 应 有 
驴 oh, 
六 和 
Ox; Ox; Gx, Ox 


式 (2-22) 和 式 (2-23) 及 等 式 约束 有 (着) =0( 和 =1,2,…,/) 就 是 点 站 达到 约束 极 
值 的 必要 条 件 。 
式 (2-21) 和 式 (2-23) 可 以 合并 写成 
of oh, oh, oh, 


BA A es (i=1,2,.…,n) (2-24 ) 





根据 目标 函 函数 (XX) 的 无 约束 极 值 条 件 征 =0 (i=1,2,…,n) ， 则 上 述 问题 的 约束 
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极 值 条 件 可 以 转换 成 无 约束 的 函数 极 值 条 件 。 办 法 是 ， 把 原来 的 目标 郴 数 扎 瑟 ) 改 

造成 为 如 下 形式 的 新 目标 消 数 : 
F(X,A) = /(X) + 之 Aihi(¥) =0 [2225) 


式 中 的 hh,( 芷 ) 就 是 原 目 标 函 数 f 作 站) 的 等 式 约束 条 件 ， 而 待定 系数 A 称 为 拉 格 
明日 乘 子 ，F( 半 ,和 A ) 称 为 拉 格 表 日 函数 。 这 种 方法 称 为 拉 格 明日 弱 子 法 。 
式 〈2-25) 中 显然 多 出 了 /个 待定 系数 A， ee 而 马 = 


(xn ) 有 于 个 变量 。 结 果 共 有 了 +1! 个 变量 。 但 是 一 =0 可 提供 n 个 方程 ， 
再 加 上 /个 等 式 约束 条 件 及 (站) =0， 共有 n+i 个 方程 ， a 

由 于 号 -=0 给 出 ji 下) =0， 所 以 这 nn +l 个 方程 可 以 看 成 是 通过 下 述 条 件 给 
出 的 : 








i 
OX, 
I 
5 


这 样 ， 拉 格 朗 日 乘 子 法 可 以 叙述 如 下 : 

设 站 "是 目标 水 数 J(X) 在 等 式 约束 h,( 对 ) =0 条 件 下 的 一 个 局 部 极 值 点 ， 而 且 
在 该 点 处 函数 的 梯度 Vh,(X") =0 (=1,2, ,1) 是 线性 无 关 的 ， 则 存在 一 个 回 
量 和 (在 /个 约束 函数 规 定 的 集 内 ) ， 使 得 下 式 成 立 : 

VF= VAX’*)+A' Vh,(X*)=0 (226) 
Rh A S(O A V(X ) =( VE ), Vh(X" ss; Vhi(X")) 

he Ai 我 们 看 函数 A/ 对 ) =f(xi,% ) 的 一 个 二 维 
问题 ， 且 只 有 一 个 约束 条 件 h(X) =h(xi ,x,) =0 时 的 简单 情况 。 此 时 ， 式 (2-25) 
a 是 








F(X,A) =f(X) + Ah(X) 
由 式 (2-24) 得 





oh 由 
OXi = OX] ” 
A LR gf 
OX2 AE OX 
所 以 上 式 可 以 与 成 yf 
浪 写 坊 oh (7=152) 


OX, 
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式 中 的 牙 是 单位 变量 的 目标 值 变化 率 ， 而 - 公 则 是 单位 变量 的 约束 值 变化 率 ， 


可 以 称 生 /名 为 优化 效率 或 敏 度 系数 。 而 且 从 - 入 /| 多 = -六 | 名 可 知 ， 各 变量 
的 改变 所 导致 的 优化 效率 是 相等 的 ， 且 等 于 一 个 常数 和。 
对 于 机 械 优化 设计 间 题 ， 若 目标 西数 /(X) 是 结构 重量 ,约束 条 件 是 结构 刚度 


或 某 点 的 变形 ， 则 区 可 以 理解 为 结构 重量 的 收益 ， 而 - 多 可 以 理解 为 结构 刚度 的 








支出 。 则 A = - 入 / 中 就 意味 着 单位 结构 的 刚度 支出 所 能 获得 的 结构 重量 收益 。 
这 时 的 入 就 反映 结构 刚度 对 甚 重量 的 优化 率 。 

例 22 用 拉 格 朗 日 乘 子 法 计算 在 约束 条 件 h(X) =h(xi,x,) =2xi +3x, -6=0 
的 情况 下 ，f( 导 ) =f(xi ,xs) =4x1 +5x2 的 极 值 点 。 

解 : 改造 的 日 标 函 数 是 F(X,A) =4x? +5x2 +A(2x +3x -6) ， 则 








oF _ po oF A 
je 1 +2A =0, 3 =10% +3A =0, 3% =2% + 3 6=0 
oF oF 
-0 和 =0 
由 Ox] OX, 
解 得 极 值 点 坐标 是 
1 3 
MT 
a ee a 30 
把 人 0 ( 即 约束 条 件 2x, +3x, -6 =0) ， 求 得 人 = 了 
1 30 3 30 
yy 和 日 er a A 党 了 1 
所 以 得 “=| 下 到 7)=1.071,% =| io) zl 7) =1.286 
即 极 值 点 X* =(1.071,1.286)" 


2.4.2 不 等 式 约束 优化 问题 极 值 点 存在 条 件 


在 约束 条 件 下 求 得 的 函数 极 值 点 ， 称 为 约束 极 值 点 。 在 优化 实用 计算 中 常 需 判 
条 和 检查 某 个 可 行 点 是 否 为 约束 极 值 点 ， 这 通常 借助 于 库 恩 - 塔 殉 〈Kuhn-Tucker ) 
条 件 〈 简 称 KT 条 件 ) 来 进行 。 

K-T 条 件 可 阐述 为 : 如 果 忆 ”是 一 个 局 部 极 小 点 ， 则 该 点 的 目标 函数 梯度 
V(X ) 可 表示 成 该 点 诸 约 束 面 梯度 Ve, (XX”) 、Vh,(X") 如 下 线性 组 合 : 


2 J 
VX) DA, Ve, (X™)- Dn,Vh,(X")=0 (2-27) 
w=1 =1 


式 中 ，9 为 在 X ”点 的 不 等 式 约束 面 数 ; j 为 在 X” 点 的 等 式 约束 面 数 ; A, (w=1,2， 
,9)、J(v=1,2,…, 站 ) 均 为 非 负 值 的 弱 子 ， 亦 称 拉 格 表 日 洋子 。 如 有 果 无 等 式 约 
束 ， 而 全 部 是 不 等 式 约束 ， 则 式 (2-27) 中 j=0， 第 三 项 全 部 为 零 。 
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也 可 以 对 K-T 条件 用 图 形 来 说 明 。 式 (2-27) 表明 ， 如 果 X'" 是 一 个 局 部 极 小 
点 ， 则 该 点 的 目标 函数 梯度 Vf (EX ) 应 落 在 该 点 诸 约束 面 梯度 Veg, (X" )、 
Vh, (对 ) 在 设计 空间 所 组 成 的 锥 角 范 围 内 。 如 图 2-11 所 示 ， 图 2-11a 中 设计 点 
导 ”不 是 约束 极 值 点 ， 图 2-11b 中 的 设计 点 ”是 约束 极 值 点 。 





















> Ar 月 
VCO) (WD VJCKO) 
xX 
VS83( ) Ves(X®) A 
及 
(0 Veg,(X®) 
Vse2CKO) < > 9 VACX ®) 
Vei(X®) 
XW Val(X®) 
祥 ® 
a) b) 


图 2-11 K-T 条 件 的 几何 意义 


以 二 维 情况 为 例 ， 将 更 形象 地 表明 K-T 条 件 。 

图 2-12 所 示 为 在 设计 点 “处 有 两 个 约束 ， 图 2-12a 表示 对 ”点 处 目标 函数 梯 
度 W(X ) 在 该 点 两 个 约束 函数 梯度 Ve,(X”)、Ve,(X” ) 组 成 的 锥 角 三 以 外 ， 
这 样 在 XY 点 邻近 的 可 行 域内 存在 目标 孔 数 值 比 A(X ) 更 小 的 设计 点 ， 故 半点 
不 能 成 为 约束 极 值 点 ; 而 图 2-12b 表示 ”点 处 V(X'" ) 落 在 锥 角 械 以内， 则 在 
该 点 附近 邻 域内 任何 目标 函数 值 比 f(X"" ) 更 小 的 设计 点 都 在 可 行 域 以 外 ， 因 而 
对 中 是 约束 极 值 点 ， 它 满足 式 (2-27) 所 示 K-T 条 件 

V(X ) -A Ve(X™) -A Ve(X'")=0 (A1=0,A,=0) 














0 VSICGKO) 


pdy, 
Vi/(X ) yg,(X®) 





gi(X 0 





a) b) 
图 2-12 二 维 子 数 K-T 条 件 图 解 
图 2-13 所 示 为 在 设计 点 对” 处 只 有 一 个 约束 ， 图 2-13a 表示 Vf (EXE ) 和 


Vg (XX ) 的 方向 不 重合 ， 在 "邻近 的 可 行 域内 存在 目标 函数 值 比 f(X" ) 更 小 的 
设计 点 ， 故 ”不 能 成 为 约束 极 值 点 ; 而 图 2-13b 中 由 于 V(X ) 和 Ve (X) 
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的 方向 重合 , 则 - (EXE ) -AVeg (对  ) =0, A >0， 此 即 当 XX” 点 处 约束 面 数 
g =1 时 的 K-T 条件， 显然 ”点 附近 邻 域 内 任何 目标 函数 值 比 A(X'" ) 更 小 的 设计 
点 都 在 可 行 域 以 外 ,对 ”点 是 约束 极 值 点 。 








V/CX®) 


VHCX) 






X2 
Ve(X®) 





图 2-13 约束 极 值 点 存在 的 条 件 











必须 指出 ，K-T 条 件 用 于 检验 设计 点 是 否 为 约束 极 值 点 ， 对 于 “ 凸 规 划 ” 问 
题 ， 即 对 于 目标 函数 成 筷 ) 为 凸 函数 、 可 行 域 为 凸 集 的 优化 问题 ， 局 部 极 值 点 与 全 
域 最 优点 相 重合 ， 如 图 2-12b、 图 2-13b 和 皆 为 凸 规 划 间 题 ,， ”点 符合 K-T 条件， 
必 为 全 域 最 优点 ,但 对 于 非 凸 规划 问题 则 不 然 。 图 2-14a 所 示 是 目标 函数 为 非 凸 函 
数 、 约 束 可 行 域 为 凸 集 ， 图 2-14b 所 示 是 目标 函数 为 同 函 数 、 约 束 可 行 域 为 非 凸 
集 ， 这 两 种 情况 在 可 行 域 中 均 可 能 出 现 两 个 或 更 多 的 局 部 极 小 点 ， 它 们 必须 都 满足 
K-T 条 件 ; 但 其 中 只 有 一 个 函数 值 最 小 的 点 于 ”是 约束 最 优点 。 在 工程 优化 设计 问 
题 中 函数 在 全 域 上 的 凸 性 不 一 定 存 在 ， 在 许多 情况 下 ， 凸 性 的 判断 亦 难 进行 。 因 此 
判断 符合 K-T 条 件 的 约束 极 值 点 是 全 域 最 优点 还 是 局 部 极 值 点 目前 仍 是 优化 研究 
的 一 个 重大 课题 。 但 凸 集 、 凸 函数 、K-T 条 件 等 在 优化 理论 和 实践 中 仍 具 有 重要 意 
义 。 亦 须 指 出 ， 用 K-T 条 件 检验 约束 极 值 点 是 指 具 有 起 作用 约束 的 可 行 点 。 如 
图 2-15 所 示 ， 无 约束 极 值 点 "处 g,(X”* ) 均 大 于 零 (u=1,2,3,4)， 这 一 约束 条 件 
对 生 " 都 不 起 作用 ，X" 亦 是 约束 极 值 点 ， 但 却 不 属于 K-T 条 件 的 范围 。 

例 2-3 用 K-T 条 件 检 验 点 ”= (2,0) 是否 为 目标 函数 /(X) = (xz -3 ) + 
xi +5 在 不 等 式 约束 : g, (于 ) =4 -x? 一 x, 宇 0、g,( 针 ) = 三 0、g; (于 ) =x, -0.5 三 0 
条 件 下 的 约束 最 优点 。 

解 : (1) 计算 ”点 的 诸 约 束 函 数值 

gi(X®H)=4-2 -0=0 
gs(X'")=0 
ga(XH)=2-0.5=1.5>0 
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图 2-15 不 属于 K-T 条 件 的 约束 极 值 点 


XX” 点 是 可 行 点 ， 该 点 起 作用 的 约束 函数 是 gj (站 ) 、g,(X)。 
(2) 求 X” 点 的 有 关 诸 梯度 


Wx) el ,= 


vl 





-1 


eel 


x2 =0 


(3) 代入 式 〈2-27) ， 求 拉 格 明日 乘 子 
V(X'™) 一 Ai Ve (X"") 一 人 2 VC =0 


[全 -人 (人 -2 们 = 
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写成 线性 方程 组 
-2+4A=0 
解 得 A =A, =0.5， 乘 子 均 为 非 负 ， 故 满足 K-T 条 件 ， 即 和 ”= (2,0) 点 为 约 
束 极 值 点 。 参 看 图 2-16 ， 亦 得 到 证 实 。 而 且 ， 由 于 矿 导 ) 是 凸 函 数 ， 可 行 域 为 凸 集 ， 
所 以 点 了 ”= (2,0) 也 是 约束 最 优点 。 








/X21 


> 


f X=14 
/(X)=9 
/ ve) 
/5 
0 这 


| 
ON 
















O 


vei(X) 


图 2-16 例 2-3 图 解 


2.5 最 优化 设计 的 数值 计算 和 迭代 法 


无 约束 优化 问题 和 约束 优化 问题 当 其 数学 模型 确定 以 后 求 其 最 优 解 ， 实 质 上 都 
属于 目标 函数 的 极 值 问题 。 两 者 的 优化 求解 方法 联系 紧密 ， 其 中 无 约束 优化 方法 又 
是 优化 方法 中 最 基本 的 方法 。 

非 线性 无 约束 最 优化 问题 解法 大 致 分 为 两 类 : 解析 法 和 数值 计算 迭代 方法 。 

解析 法 是 采用 导数 寻求 函数 极 值 的 方法 ， 其 特点 是 以 数 尝 分 析 为 工具 ， 古 典 的 
微分 法 就 属于 这 一 类 。 例 2-1 表明 了 无 约束 非 线性 最 优化 问题 用 解析 法 求 极 值 点 的 
过 程 。 它 根据 目标 函数 极 值 点 存在 的 必要 条 件 式 (2-9) ， 用 数学 分 析 的 方法 求 出 方 
程 组 的 根 《〈 驻 点 ) ， 再 用 式 (2-8) 计算 驻 点 处 的 墨 塞 矩 阵 来 判别 是 否 符合 男 数 
极 值 点 存在 的 充分 条 件 。 如 符合 ， 驻 点 X" 即 为 极 值 点 ， 问 题 就 能 解决 了 。 但 在 工 
程 设计 中 ， 往 往 由 于 目标 函数 比较 复杂 ， 从 而 求 不 出 或 难以 求 出 目标 函数 /( 半 ) 对 
各 目 变 量 的 俩 导数 ， 此 时 无 法 形成 方程 组 (2-9) ， 同 时 即使 能 得 到 该 方程 组 ， 也 往 
往 是 高 次 非 线性 的 方程 组 ， 使 用 解析 法 来 求解 驻 点 极为 困难 。 此 外 ， 要 判别 墨 塞 矩 
阵 是 否 为 正定 ， 一 般 是 很 烦琐 的 ， 有 时 甚至 不 能 用 于 具体 计算 之 中 。 这 类 寻 优 方法 
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仅 适 用 于 求解 目标 函数 具有 简单 而 明确 的 数学 形式 的 非 线 性 规划 问题 。 而 对 于 目标 
哨 数 比较 复杂 甚至 无 明确 的 数学 表达 式 的 情况 ， 这 种 方法 显得 求解 效率 极 低 或 无 能 
为 力 。 这 时 应 采用 数值 计算 迭代 法 。 

数值 计算 碗 代 法 是 直接 从 目标 函数 A 站 ) 出 发 ， 使 目标 咀 数 值 逐 次 下 降 还 近 ， 
利用 计算 机 进行 迭代 ， 一 步 步 搜 索 、 调 优 并 最 后 到 近 到 水 数 极 值 点 或 达到 最 优点 。 
根据 确定 搜索 方向 和 步 长 的 方法 不 同 ， 数 值 计算 寻 优 可 有 许多 方法 ,但 其 共同 
点 是 : 

1) 要 具有 简单 的 逻辑 结构 并 能 进行 同一 迭代 格式 的 反复 运算 ; 

2) 这 种 计算 方法 所 取得 的 结果 不 是 理论 精确 解 ， 而 是 近似 解 ， 但 其 精度 是 可 
以 根据 需要 加 以 控制 的 。 


2.5.1 友 代 法 的 基本 思想 及 其 格式 


迭代 法 是 适应 于 计算 机 工作 特点 的 一 种 数值 计算 方法 。 其 基本 思想 是 : 在 设计 
空间 从 一 个 初始 设计 点 开始 ， 应 用 某 一 
规定 的 算法 ， 沿 某 一 方向 SW 和 步 长 a 产 
生 改 进 设计 的 新 点 X'" 使 得 f(XY) < 
fA(X"”)， 然 后 再 从 和 点 开始 ， 仍 应 用 同一 
算法 ， 沿 某 一 方向 S' 和 步 长 a 产生 又 有 
改进 的 设计 新 点 ”,， 使 得 f(X”) < 
A(X )， 这样 一 步 一 步 地 搜索 下 去 ,使 目 
标 函 数值 步 步 下 降 ， 直 至 得 到 满足 所 规定 
精度 要 求 的 、 通 近 理论 极 小 点 的 下 "点 为 止 。 
这 种 寻找 最 优点 的 反复 过 程 称 为 数值 迭代 
过 程 。 图 2-17 所 示 为 二 维 无 约束 最 优化 迭 
代 过 程 示意 图 。 
无 约束 最 优化 算法 ， 每 次 迭代 都 按 一 选 定 方 向 S$ 和 一 合适 的 步 长 w 向 前 搜索 ， 
可 以 写 出 迭代 过 程 逐 次 搜索 新 点 的 向 量 方程 : 
YD 二 万 (0) mw(0 Sg) 
龙 2) Ne 












































图 2-17 二 维 无 约束 最 优化 迭代 过 程 


迭代 过 程 的 每 一 步 向 量 方程 ， 都 可 写成 如 下 的 迭代 格式 : 
Xa sy (a0 ls) (2-28 ) 
式 中 ,和 革 ” 为 第 步 迭代 的 出 发 点 ; 于 为 第 左 步 迭代 产生 出 的 新 点 ; S ”为 向 
量 ， 代 表 第 大 步 迭 代 的 前 进 方向 〈 或 称 搜索 方向 ) ;w ”为 标量 ， 代 表 第 天 步 沿 S” 
方 回 的 送 代 步 长 (或 称 步 长 因子 )。 
在 一 系列 的 枕 代 计算 k=0，1，2，… 过 程 中 ， 产 生 一 系列 的 枕 代 点 (点 列 ): 
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于 中 ，XOD，.…， 于 0 ，XGc0 ，.…， 为 实现 极 小 化 ， 目 标 函 数 FEX) 的 值 应 一 次 比 
一 次 减 小 ， 即 
FAROS SIR SA SAE) SA DN) (2229) 
直至 迭代 计算 满足 一 定 的 精度 时 ， 则 认为 目标 函数 值 近似 收敛 于 其 理论 极 
小 值 。 


2.5.2 迭代 计算 的 终止 准则 


按理 我 们 当然 希望 迭代 过 程 进 行 到 最 终 迭 代 点 到 达 理 论 极 小 点 ， 或 者 使 最 终 迭 
代 点 与 理论 极 小 点 之 间 的 距离 足够 小 到 允许 的 精度 才 终 止 和 迭 代 。 但 是 ， 在 实际 上 对 
于 一 个 待 求 的 优化 问题 ， 其 理论 极 小 点 在 哪里 并 不 知道 。 实 际 上 只 能 从 迭代 过 程 获 
得 的 迭代 点 序列 着 ”， 对 和”，X 下，…， 了 路 "* 所 提供 的 信息 ， 根 据 一 定 的 准 
则 判断 出 已 取得 足够 精确 的 近似 极 小 点 时 ， 和 迭代 即 可 终止 。 最 后 所 得 的 点 即 认为 是 
接近 理论 极 小 点 的 近似 极 小 点 。 对 无 约束 最 优化 问题 常用 的 送 代 过 程 终止 准则 一 般 
有 以 下 几 种 : 

(1) 点 距 准则 ” 当 相 邻 两 迭代 点 XX ”、X“' 之 间 的 距离 已 达到 充分 小 时 ， 即 
小 于 或 等 于 规定 的 某 一 很 小 正 数 e 时 ， 和 迭代 终止 。 一 般 用 两 个 迭代 点 向 量 差 的 模 来 
表示 ， 即 























[D0 S404 = (2-30) 
或 用 对 “1 和 在 各 坐标 轴 上 的 分 量 差 来 表示 ， 即 
RD -Xs (i=1,2,.…,n) (2-31) 








(2) 函数 下 降 量 准则 ” 当 相 邻 两 迭代 点 和 ”、X“* 的 目标 函数 值 的 下 降 量 已 
达到 充分 小 时 ， 即 小 于 或 等 于 规定 的 某 一 很 小 正 数 s 时 ， 和 迭代 终止 。 一 般 用 目标 函 
数值 下 降 量 的 绝对 值 来 表示 ， 即 

A(X ) -fAX® se SIA XY )1<1) (2-32) 
或 用 目标 函数 值 下 降 量 的 相对 值 来 表示 ， 即 
(k+1) (k) 
0 ea 1 (2-33) 

(3) 梯度 准则 ” 当 目 标 函 数 在 迭代 点 X¥“* "的 梯度 已 达到 充分 小 时 ， 即 小 于 或 

等 于 规定 的 某 一 很 小 正 数 s 时 ， 和 迭代 终止 。 一 般 用 梯度 向 量 的 模 来 表示 ， 即 
| YX ) se (2-34) 

以 上 各 式 中 的 s 根据 不 同 的 优化 方法 和 具体 设计 问题 对 精度 的 要 求 而 定 。 一 般 
来 说 ， 这 几 个 迭代 过 程 终 止 准 则 都 分 别 在 某 种 意义 上 反映 了 逼近 极 值 点 的 程度 ， 只 
要 满足 其 中 任 一 个 迭代 终止 准则 ， 都 可 以 认为 目标 函数 六 于 ) 收敛 于 函数 
所 KE ) 的 极 小 值 ， 对 凸 规划 问题 即 为 近似 最 优 解 : ”= 于 7 和 JE ) = 
A(X"* )， 从 而 可 以 结束 迭代 计算 。 和 迭代 过 程 中 每 一 步 迭 代 得 一 新 点 ,一般 都 要 
以 终止 准则 判别 是 否 收 僵 。 如 果 不 满足 ， 则 应 再 进行 下 一 步 迭 代 ， 直 到 满足 迭代 终 
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止 准则 为 止 。 

上 述 几 种 迭代 终止 准则 ， 除 式 (2-34) 所 示 梯度 准则 仅 用 于 那些 需要 计算 目标 
函数 梯度 的 最 优化 方法 外 ， 其 余 并 无 特别 规定 必须 选用 哪 一 种 。 有 时 为 了 防止 函数 
变化 剧烈 式 (2-30) 所 示 点 距 准则 失效 ( 见 图 2-18a)，, 或 当 函 数 变化 缓慢 时 式 
(2-32) 所 示 函 数 下 降 量 准 则 失效 ( 见 图 2-18b) ， 这 时 往往 将 点 距 准 则 和 函数 下 降 
量 准则 结合 起 来 ， 使 之 同时 成 立 。 最 后 尚 需 指 出 ， 迭 代 终 止 准则 并 不 限于 上 述 几 
种 ， 这 将 在 讲述 采用 其 他 终止 准则 的 优化 方法 时 再 做 介绍 。 



































xD yt) 


a) b) 


图 2-18 和 迭代 终止 准则 


第 3 攻 一 维 搜索 万 法 


3.1 概述 








在 优化 设计 的 迭代 运算 中 ， 在 搜索 方向 S ”上 寻求 最 优 步 长 w ”的 方法 称 为 一 
维 搜索 方法 。 其 实 ， 一 维 搜索 方法 就 是 一 元 函数 极 小 化 的 数值 和 迭代 算法 ， 其 求解 过 
程 称 为 一 维 搜索 。 一 维 搜索 方法 是 构成 非 线 性 优化 方法 的 基本 算法 ， 因 为 多 元 函数 
的 迭代 解法 都 可 归结 为 在 一 系列 逐步 产生 的 下 降 方 向 上 的 一 维 搜索 。 

从 点 着” 出 发 ， 在 方向 S$， 上 的 一 维 搜索 可 用 数学 式 表 达 如 下 : 

minf( 及 Fe =f(X” + Qa,S'” ) 
对 二 守信 +oaS™ 

此 式 表 示 对 包含 唯一 变量 a 的 一 元 函数 J 儿 XW +ayS"” ) 求 极 小 值 ， 得 到 最 优 步 
长 w ”和 方向 $S ”上 的 一 维 极 小 点 于 7) 。 

一 维 搜索 的 数值 解法 可 分 两 步 进行 :首先 在 方向 SW 上 确定 一 个 包含 极 小 点 的 
初始 区 间 ， 然 后 用 缩小 区 间或 插值 逼近 的 方法 逐步 得 到 最 优 步 长 和 一 维 极 小 点 。 


























3.2 搜索 区 间 的 确定 与 区 间 消 去 法 原理 





欲求 一 元 函数 A 作 x) 的 极 小 点 x”( 为 书写 简便 ， 这 里 仍 用 同一 符号 表示 相应 
的 一 元 函数 ) ， 必 须 先 确定 xz 所 在 的 区 间 。 

1. 确定 搜索 区 间 的 外 推 法 

在 一 维 搜索 时 ， 我 们 假设 函数 A 儿 x) 具 有 如 图 3-1 所 示 的 单 谷 性 ， 即 在 所 考虑 的 
区 间 | oa ,内 部 函数 所 xz) 有 唯一 的 极 小 点 zx ， 
为 了 确定 极 小 点 zx 所 在 的 区 间 La,6] ， 应 使 
孙 数 (x) 在 区 间 [a,b] 上 形成 “高 - 低 -高 ” 


趋势。 
为 此 ， 从 wa =0 开始 ， 以 初始 步 长 如 回 前 
试探 。 如 采 本 数值 上 升 ， 则 步 长 变 号 ， 即 改 | 


变 试探 方 同 。 如 果 隐 数 值 下 降 ， 则 维持 原来 
的 试探 方 徊 ， 并 将 步 长 加 售 。 区 间 的 始点 、 
中 间 点 依次 沿 试探 方向 移动 一 步 。 此 过 程 一 
下 进行 到 函数 值 再 次 上 升 时 为 止 ， 即 可 找到 图 3-1 具有 竺 谷 性 的 函数 


Jf 00) 





| 
| 
| 
O a pe pb x 
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搜索 区 间 的 终点 。 最 后 得 到 的 三 点 即 为 搜索 区 间 的 始点 、 中 间 点 和 终点 ， 形 成 函数 
值 的 “高 - 低 -高 ”趋势 。 

图 3-2 表示 沿 a 的 正 问 试 探 。 每 走 一 步 都 将 区 间 的 始点 、 中 间 点 沿 试探 方向 移 
动 一 步 (进行 换 名 ) 。 经 过 三 步 最 后 确定 搜索 区 间 [ai ,as | ， 并 且 得 到 区 间 始 点 、 
中 间 点 和 终点 ol <a < 所 对 应 的 困 数 值 m >y <Yy3。 

图 3-3 所 表示 的 情况 是 ， 开 始 是 沿 a 的 正方 向 试探 ,但 由 于 函数 值 上 升 而 改变 
了 试探 方向 ， 最 后 得 到 始点 、 中 间 点 和 终点 >a, < @; 及 它们 的 对 应 函数 值 
yi1 >y; <y3， 从 而 形成 单 谷 区 间 [ as ,a ] 为 一 维 搜索 区 间 。 





























CQ3 (2 < 一 03 OO dl<—4> a 


O 2 03 a a 0 
图 3-2 正 疝 搜索 的 外 推 法 图 3-3 反问 搜索 的 外 推 法 











上 述 确定 搜索 区 间 的 外 推 法 ， 其 程序 框图 如 图 3-4 所 示 。 

2. 区 间 消 去 法 原理 

搜索 区 间 [a,bj] 确 定之 后 ， 采 用 区 间 消 去 法 逐步 缩短 搜索 区 间 ， 从 而 找到 极 小 
点 的 数值 近似 解 ,假定 在 搜索 区 间 内 任 取 两 点 a;:/、b1，al <， 并 计算 函数 值 
f(al)、f(b1)。 于 是 将 有 下 列 三 种 可 能 情形 : 

1) f(a ) <f(5)， 如 图 3-5a 所 示 。 由 于 函数 为 单 谷 ， 所 以 极 小 点 必 在 区 间 
[a,b1 | 内。 

2) f(al) >f(bi)， 如 图 3-5b 所 示 。 同 理 ， 极 小 点 应 在 区 间 [al,b] 内 。 

3) f(a ) =f(2b;)， 如 图 3-5c 所 示 ， 这 时 极 小 点 应 在 [a ,bi ] 内 。 

根据 以 上 所 述 ， 只 要 在 区 间 [a,5j 内 取 两 个 点 ， 算 出 它们 的 孔 数 值 并 加 以 比 
较 ， 就 可 以 把 搜索 区 间 [a,bj] 缩短 成 [a,b jj 或 [al,b]。 应 当 指 出 ， 对 于 第 一 种 情 
况 ， 我 们 已 算出 区 间 [a,b1 内 点 41 的 函数 值 ， 如 果 要 把 搜索 区 间 [a,b ] 进一步 缩 
短 ， 只 需 在 其 内 再 取 一 点 算出 函数 值 并 与 所 w ) 加 以 比较 ， 即 可 达到 目的 。 对 于 第 
二 种 情况 ， 同 样 只 需 再 计算 一 点 函数 值 就 可 以 把 搜索 区 间 继 续 缩 短 。 第 三 种 情形 与 
前 面 两 种 情形 不 同 ， 因 为 在 区 间 [ a ,bi ] 内 缺少 已 算出 的 函数 值 。 要 想 把 区 间 [ a， 
bi |] 进一步 缩 短 ， 需 在 其 内 部 取 两 个 点 (而 不 是 一 个 点 ) 计算 出 相应 的 函数 值 再 加 
以 比较 才 行 。 如 果 经 党 发 生 这 种 情形 ， 为 了 缩短 搜索 区 间 ， 需 要 多 计算 一 倍数 量 的 
函数 值 ， 这 就 增加 了 计算 工作 量 。 因 此 ， 为 了 避免 多 计算 函数 值 ， 我 们 把 第 三 种 情 














-> 
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形 合 并 到 前 面 两 种 情形 中 去 。 例 如 ， 可 以 把 前 面 三 种 情形 改 为 下 列 两 种 情形 : 
1) 大 fa) <f(51)， 则 取 La,bi ] 为 缩短 后 的 搜索 区 间 。 
2) fa) > 拟 六 ) ， 则 取 [ oO 为 缩短 后 的 搜索 区 间 。 






a1—b, y» f(a2) 


国 












ha——h 
a3—a1, 7371 





d1<—42,， J 
42<—43， oy3 


a3— qth, ys f(a3) 


打印 a1, a2, a3 
| 


图 3-4 外 推 法 的 程序 框图 


f(b1) f(a1) 
: b 
f(al) A f(al) f(b1) 


图 3-5 区 间 消 去 法 原理 
a) flai) <f(01) b) fla1) >f01) ce) flal) = 所 六 ) 
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3.3 黄金 分 割 法 


黄金 分 割 法 亦 称 0. 618 法 ， 它 是 按照 对 称 原则 选取 中 间 搬 入 点 而 缩小 区 间 的 一 
种 一 维 搜索 算法 。 


3.3.1 基本 原理 
设 区 间 [a ,如 内 的 两 个 中 间 搬 入 点 由 以 下 方式 产生 : 


Xi =w+(1-A)( =-w) 
(0< 和 <1) (3-1) 
Xx, =a+A(b-a) 

奋 缩小 一 次 后 的 新 区 间 为 [a,x,] ， 则 如 图 3-6 所 
示 ， 由 于 新 旧 区 间 内 中 间 插 入 点 应 具有 相同 位 置 关 
系 ， 原 区 间 内 的 点 和 新 区 间 内 的 点 x, 实际 上 是 同 
人 局 收 有 有 








A =A-l1 
由 此 解 得 





2 Xl X2 b 

1 人) 和 
Xi =a +0.382(b -a) 
Xx, =a +0.618(b 一 wa) 


图 3-6 ”新旧 区 间 比 例 关系 





这 就 是 黄金 分 割 法 的 迭代 公式 ，0. 618 法 也 因此 而 得 名 。 
黄金 分 割 法 以 区 间 长 度 是 否 充 分 小 作为 收 合 准 则 ， 并 以 收敛 区 间 的 中 点 作为 一 
维 搜索 的 极 小 点 ， 即 当 2 -和 es 时 ， 取 
vw* -9 +b 
2 


不 难看 出 ， 黄 金 分 割 法 每 次 区 间 缩 小 的 比率 是 完全 相等 的 。 如 果 将 新 区 间 的 长 
度 和 原 区 间 的 长 度 之 比 称 作 区 间 缩 小 率 ， 则 黄金 分 割 法 的 区 间 缩 小 率 等 于 篆 数 
0. 618。 如 果 给 定 收敛 精度 =。、 初 始 区 间 长 度 上 -aa， 则 完成 一 维 搜索 所 需 缩小 区 间 
的 次 数 半 可 以 由 下 式 求 出 : 














0 0 
in ) 
b-a 
人 
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3.3.2 迭代 过 程 及 算法 框图 


综 上 所 述 ， 黄 金 分 割 法 的 计算 步 又 如 下 : 
1) 给 定 初 始 区 间 [ a,6b] 和 收敛 精度 e。 
2) 产生 中 间 插 入 点 并 计算 其 函数 值 : 

Xi =a +0.382(b6 -a),fi =f(x) 

Xx, =a +0.618(b -a),p =f(x,) 
3) 比较 函数 值 f 和 5， 确 定 区 间 的 取舍 : 
Sn < 广 ， 则 新 区 间 [a ,oj =[a,x, |] ， 令 b=%,， x =%1, f=fi, N=0; 
若 亡 >， 则 新 区 间 [a,b|] =[xi,6],; 令 a=xi, xi =%x;, 有 =， 记 N=1， 如 

多 3-7 所 示 。 
万 有 





a) 
图 3-7 区 间 取 含 


4) 收敛 判断 : 若 区 间 的 长 度 足够 小 ， 即 满足 15 - else， 则 将 区 间 中 点 作为 
一 维 极 小 点 ， 即 令 *” = 全 ， 结 束 一 维 搜索 ; 否则 ， 转 5)。 


5) 产生 新 的 插入 点 : 奉 Ni =0， 则 取 xi =a +0.382(5-a), fi =f(xi); 奉 
和 N=1， 则 取 x, =a+0.618(5-a), =f(x,)。 转 3) 进行 新 的 区 间 缩 小 。 

黄金 分 割 法 的 迭代 过 程 和 程序 框图 如 图 3-8 所 示 。 

例 3-1 用 黄金 分 割 法 求 函 数 扩 xz) =3 x -4 +2 的 极 小 点 ， 给 定 xo =0, =1， 
£ =0.2, 

解 : (1) 确定 初始 区 间 











x1 =%o =0, fi =f(x1) =2 
| 
由 于 fi > 户 应 加 大 步 长 继续 向 前 探测 。 令 
2 02 (ld 
由 于 < 态 可 知 初始 区 间 已 经 找到 ， 即 [a,b] =[0,2] 
(2) 用 黄金 分 割 法 缩小 区 间 
1) 第 一 次 缩小 区 间 : 
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=a+0.382(b-a), fi=f (x1) 
=a+0.618(b-a), ff (2) 








Xx1=a+0.382(b-a) 
fi 71) 








Xx2=a+0.618(p-a) 
J (x2) 
结束 


图 3-8 ”黄金 分 割 法 的 程序 框图 


x =0 +0.382(2 -0) =0.764, f, =0. 282 
由 于 fi < 及， 故 新 区 间 [ a,5] = [a,x;] =[0,1.236] 
因为 6-a=1.236 >0.2 所 以 应 继续 缩小 区 间 。 
2) 第 二 次 缩小 区 间 : 
今 
x =%; =0.764,f, =f; =0. 282 
x =0 +0. 382(1.236 -0) =0.472, f; =0. 317 
由 于 有 > 户 ， 故 新 区 间 为 Loc,] = [xi,b] =|0.472,1.236|] 
3) 第 三 次 缩小 区 间 : 
> 
xi =%, =0.764,f, =f, =0. 282 
x, =0. 472 +0. 618 x (1.236 -0.472) =0. 944, f, =0.747 
由 于 有 <， 故 新 区 间 为 [a,b|] = | a,x, | =|0.472,0. 944| 
4) 第 四 次 缩小 区 间 : 
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今 
x, =X% =0.764, =f; =0. 282 
xi =0. 472 +0.382(0. 944 -0. 472) =0. 652, f. =0. 223 
由 于 有 < 户 ， 故 新 区 间 为 Lc,g] = La,x,|] =[0.472,0.764 
因为 5-a=0.764 -0.472 =0.292 >0.2, 所 以 应 继续 缩小 区 间 。 
5) 第 五 次 缩小 区 间 


2 


x =X =0. 652,f, =f, =0. 223 
xi =0. 472 +0. 382(0.764 -0.472) =0. 584, f; =0. 262 
由 于 有 > 有 ， 故 新 区 间 为 La,b] =|[xi,b] =[0.584,0.764 | 
因为 5-a=0.764 -0.584 =0.18 <0.2 
所 以 得 到 极 小 点 和 极 小 值 分 别 为 
xz* =0.5x(0.584 +0.764) =0. 674, f* =0. 222 


3.4 二 次 插值 方法 





二 次 插值 方法 又 称 抛物 线 法 ， 它 是 以 目标 函数 的 二 次 插值 也 数 的 极 小 点 作为 新 
的 中 间 搬 入 点 进行 区 间 缩 小 的 一 维 搜索 算法 。 


3.4.1 基本 原理 


已 知 初始 区 间 [a,5j] 及 区 间 内 的 一 个 点 <， 则 可 得 到 相 邻 的 三 个 点 且 a <c<5b 

及 其 对 应 的 函数 了 >f. >fi， 记 为 x1 =w，x2 = c， x3 =0, fi =, f=f., f3 =,o 在 

fOx 坐标 平面 ,， 过 (zi ,fi)，(%, 记 )，(%3 ,fs) 可 以 构成 一 个 二 次 插值 函数 ， 设 该 插 
值 聘 数 为 

p(x%) =a tax +a,x” (32) 


将 函数 对 x 求 导 ， 得 极 小 点 


,= -二 Ce 
将 区 间 内 的 三 点 及 其 函数 值 代入 式 (3-2) 有 


fi =ao +aixi + Qsxi 
f=a0 +aliXA + Qs%2 
f=a0 +aliX3 + QsX3 
联 立 求解 以 上 方程 组 ， 可 得 系数 wo a! 、a,， 将 它们 代入 式 (3-3) 有 
a ta 
“hh 





(34, 


和 


~ 
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起 54) 权 汰 
%, =0.5(%1 +%3 一 CiVc5) (3-5) 
由 式 (3-5) 求 出 的 %, 是 插值 函数 〈3-2) 的 极 小 点 ， 也 是 原 目 标 函 数 的 一 个 
近似 极 小 点 。 以 此 点 作为 下 一 次 收缩 区 间 的 一 个 中 间 插 入 点 ， 无 疑 将 使 新 的 插入 点 
问 极 小 点 通 近 的 过 程 加 快 ， 如 图 3-9 所 示 。 

















O X1 X2 Xp Wy 


a) b) 


图 3-9 二 次 搬 值 法 的 区 间 缩 小 和 通 近 过 程 


二 次 插值 法 的 中 间 插 入 点 包含 了 函数 在 三 个 点 上 的 函数 值 信息 ， 因 此 这 样 的 插 
入 点 比较 接近 函数 的 极 小 点 。 

二 次 插值 法 以 两 个 中 间 插 入 点 的 距离 充分 小 作为 收敛 准则 ， 即 当 1x, =- 筷 1 大 e 
成 立时 ,把 x%, 作为 此 次 一 维 搜索 的 极 小 点 。 


3.4.2 和 迭代 过 程 及 算法 框图 


二 次 插值 法 的 计算 步骤 如 下 : 

1) 给 定 初 始 区 间 [ ce, 、 收 和 敛 精度 < 和 区 间 中 的 为 外 一 个 点 c。 

2) 将 三 个 已 知 点 按 顺 序 排列 : xi =w，x2 = ec， x%3=6, fi =f(%1), fo =f(%,), 
f=f(%3)o 

3) 按 式 (3-4) 或 按 式 (3-5) 计算 中 间 插 和 人 点 及 其 隐 数 值 f, =f (x,)。 

4) 收敛 判断 : 看 12 -*1<e, lf -flse， 则 转 6) 否则 ， 转 5) 。 

5) 缩小 区 间 : 

ph， 月 当 %; 志 %;， A 一 X%2，X%2 二 Xp， fa =f,, fo =/,; 且 当 x， > X2 ， 令 
X1 = NX, XC— XN,, fi1 =f, J =/,; 

行 矿 > 广 ， ,<%, 令 和 1 二 X%1， fi = 且 当 x, >%,, 令 YX 二 Xp 有 =f,o 

转 3) 求 新 的 插入 点 。 

6) /三思 ， 则 令 x”=%,,， f= 有 ; 否则 ， 令 x”=x,，f/ ”= ， 结 束 一 维 搜索 。 
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二 次 插值 法 的 区 间 取 侈 及 蔡 换 如 图 3-10 所 示 ， 程 序 框图 如 图 3-11 所 示 。 





万 1p fp 
如 jp ] 0 用 | 
Xl] Xp X2 X3 Xl X2 Xp X3 Xp X2 X3 Xl X2 Xp X3 
X2 X3 X1 2X2 Xl X3 
a) b) 


图 3-10 二 次 插值 法 的 区 间 取 侈 及 替换 


给 定 初始 区 间 及 其 函数 值 


a、 b、 c 及 ff 、 人 J/ 取 E 











令 Xx1=q，X2=c，X3=b 


far does flo 











Xp=0.5(xX1+X3-C1/C2) 


fA 0%) 





XX] 二 X2 E X2 Xp 


hh, dy 





图 3-11 二 次 插值 法 的 程序 框图 


例 3-2 用 二 次 插值 法 求解 例 3-1。 
解 : (1) 初始 区 间 的 确定 
初始 区 间 的 确定 与 上 题 相 同 。 即 | a,6] =10,2]， 为 有 一 中 间 点 x, =1。 
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(2) 用 二 次 插值 法 接近 极 小 点 
1) 记 此 初始 区 间 内 的 相 邻 三 点 及 其 函数 值 依 次 为 xi =0, x, = 上 ，xa3 =2, 万 = 
2, p=1, f=18， 将 它们 代入 式 (3-4)， 得 插值 函数 的 极 小 点 ， 即 新 的 插入 点 及 
其 函数 值 : 
本 C1 0 (2 三 (0 过 1 (人 三 于 让 光志 i 
2 (1 -2)x2+(2-0)xl+(0-1)x18 
f£, =0. 293 
由 于 f, < 及，%, <*， 故 新 区 间 为 
[a,b] =|a,x,] =[0,1] 
由 于 lx -x,| =1 一 0.555 =0.445 >0.2， 故 应 继续 做 第 二 次 插值 计算 。 
2) 在 新 的 区 间 内 ， 相 邻 三 点 及 其 函数 值 依次 为 x =0，x =0.555, x = |， 
=2, 罗 =0:293, 有 =1; 将 它们 代入 式 (3=4) 得 
%, =0. 003 
7 0222 
由 于 f/f, < 及 ，%, > x*2， 政 新 区 间 为 
[6 答 区 > 一 | 0.S55 ,1 | 
由 于 lx, -x,1 = 10.555 -0. 6631 = 0. 108 <0.2， 故 一 维 搜索 到 此 结束 ， 极 小 点 
和 极 小 值 分 别 为 





x* =0.663,f* =0. 222 
由 以 上 计算 可 以 看 出 ， 二 次 插值 法 的 收敛 速度 比 黄金 分 割 法 快 得 多 。 


第 4 全 无 约束 优化 方法 


4.1 概述 


大 多 数 机 械 优化 设计 问题 ， 都 是 在 一 定 的 限制 条 件 下 追求 某 一 指标 为 最 小 ， 所 
以 它们 都 属于 约束 优化 问题 。 但 是 ， 也 有 些 实际 问题 ， 其 数学 模型 本 里 就 是 一 个 无 
约束 优化 问题 ， 或 者 除了 在 非常 接近 最 终极 小 点 的 情况 下 ， 都 可 以 按 无 约束 问题 来 
处 理 。 人 研究 无 约束 优化 问题 的 男 一 个 原因 是 ， 通 过 熟悉 它 的 解法 可 以 为 研究 约束 优 
化 问题 打下 良好 的 基础 。 第 三 个 原因 是 ， 约 束 优化 问题 的 求解 可 以 通过 一 系列 无 约 
束 优化 方法 来 达到 。 所 以 无 约束 优化 问题 的 解法 是 优化 设计 方法 的 基本 组 成 部 分 ， 
也 是 优化 方法 的 基础 。 

无 约束 优化 问题 是 : 求 n 维 设计 变量 

X 二 区 ) 2 ;0 ,Xa 

使 目标 函数 作对) 一 min， 而 对 竺 没有 任何 限制 条 件 。 

对 于 无 约束 优化 问题 的 求解 ， 可 以 直接 应 用 第 3 章 讲述 的 极 值 条 件 来 确定 极 值 
点 位 置 ， 这 就 是 把 求 孔 数 极 值 的 问题 变 成 求解 方程 

Vv/=0 


























的 问题 。 即 求 症 ,使 其 满足 
0 
O XI 
2 
0 X, (4-1) 


0 
OX， 
这 是 一 个 含有 个 未 知 量 、n 个 方程 的 方程 组 ， 并 且 一 般 是 非 线性 的 。 除 了 一 
些 特殊 情况 外 ， 一 般 来 说 非 线 性 方程 组 的 求解 与 求 无 约束 极 值 一 样 也 是 一 个 困难 问 
题 ， 甚 至 前 者 比 后 者 更 困难 。 对 于 非 线性 方程 组 ， 一 般 是 很 难 用 解析 方法 求解 的 ， 
需要 采用 数值 计算 方法 逐步 求 出 非 线性 联 立 方程 组 的 解 。 但 是 ， 与 其 用 数值 计算 方 
法 求解 非 线 性 方程 组 ， 倒 不 如 用 数值 计算 方法 直接 求解 无 约束 极 值 问题 。 因 此 ， 本 
章 将 介绍 求解 无 约束 优化 问题 常用 的 数值 解法 。 
数值 计算 方法 最 常用 的 是 搜索 方法 ， 其 基本 思想 是 从 给 定 的 初始 点 对 ”出 发 ， 
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沿 某 一 搜索 方向 5S'” 进行 搜索 ， 确 定 最 佳 步 长 w'"" 使 函数 值 沿 方向 8 ”下降 最 大 。 依 
此 方式 按 下 述 公 式 不 断 进 行 , 形成 迭代 的 下 降 算 法 : 
于) RY ra Ss) (k=0,1,2,.…) (42) 

各 种 无 约束 优化 方法 的 区 别 就 在 于 确定 其 搜索 方向 8” 的 方法 不 同 。 所 以 ， 搜 
索 方 向 的 构成 问题 力 是 无 约束 优化 方法 的 关键 。 

X10 = 于 0 +a SS 中 ，$S ”是 第 上 +1 次 搜索 或 迭代 方向 ， 称 为 搜索 或 迭代 
方向 ， 它 是 根据 数学 原理 由 目标 函数 和 约束 条 件 的 局 部 信息 状态 形成 的 。 确 定 $” 
的 方法 有 很 多 ， 相 应 地 确定 使 f(X"” +a SW ) 取 极 值 的 a'”= w 的 方法 也 是 不 同 
的 ， 具 体 方法 已 在 第 3 章 “ 一 维 搜索 方法 ”中 进行 了 讨论 。 

SW 和 a 的 形成 和 确定 方法 不 同 就 派生 出 不 同 的 n 维 无 约束 优化 问题 的 数值 
解法 。 因 此 ， 可 对 无 约束 优化 的 算法 进行 分 类 。 其 分 类 原则 就 是 依 式 X“*”= 
于 0 +a' Sm 中 的 SW 和 相应 的 a 的 形成 或 确定 方法 而 定 的 。 

根据 构成 搜索 方向 所 使 用 的 信息 性 质 的 不 同 ， 无 约束 优化 方法 可 以 分 为 两 类 。 
类 是 利用 目标 函数 的 一 阶 或 二 阶 导数 的 无 约束 优化 方法 ， 如 最 速 下降 法 、 共 斩 梯 
度 法 、 和 牛顿 法 及 变 尺 度 法 等 。 另 一 类 是 只 利用 目标 函数 值 的 无 约束 优化 方法 ， 如 坐 
标 轮换 法 、 单 形 奉 换 法 及 鲍威尔 〈Powel) 法 等 。 本 章 将 分 别 讨论 上 述 两 类 无 约束 
优化 方法 。 












































4.2 最 速 下 降 法 


4.2.1 基本 原理 


优化 设计 是 追求 目标 函数 值 f(X) 最 小 ， 因 此 一 个 很 自然 的 想法 是 从 某 点 对 出 
发 ， 其 搜索 方向 $ 取 该 点 的 负 梯 度 方向 - W(X) (最 速 下 降 方 向 ) ， 使 函数 值 在 该 
点 附近 的 范围 内 下 降 最 快 。 按 此 规律 不 断 走 步 ， 形 成 以 下 迭代 的 算法 : 

XD = -at VX) (4-3) 

由 于 最 速 下 降 法 是 以 负 梯 度 方向 作为 搜索 方向 ， 所 以 最 速 下 降 法 又 称 为 梯度 法 。 

为 了 使 目标 函数 值 沿 搜索 方向 - VA(X) 能 获得 最 大 的 下 降 值 ， 其 步 长 因子 应 
取 一 维 搜索 的 最 佳 步 长 ”5 。 即 有 

用 导 0 ) = -ao VOX)) =minf ((X™ -a VX)) =minp(a) 

根据 一 元 函数 极 值 的 必要 条 件 和 多 元 复合 函数 求 导 公式 ， 即 有 
































(el Vo VA ON WE a 
即 [ V(X) VX™)=0 
或 写成 CO 三 省 





由 此 可 知 ， 在 最 速 下 降 法 中 ， 相 邻 两 个 迭代 点 上 的 函数 梯度 相互 简直。 而 搜索 
方向 就 是 负 梯 度 方 向 ， 因 此 相 邻 两 个 搜索 方向 互相 垂直 。 这 就 是 说 在 最 速 下 降 法 
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中 ， 闪 代 点 向 函数 极 小 点 徘 近 的 过 程 ， 走 的 是 曲折 的 路 线 。 这 一 次 搜索 方向 与 前 一 
次 的 搜索 方 回 互相 垂直 ， 形 成 “之 ”字形 的 锯齿 现象 ， 见 图 4-1。 从 直观 上 可 以 看 
到 ， 在 远离 极 小 点 的 位 置 ， 每 次 检 代 可 使 函数 值 有 较 多 的 下 降 。 可 是 在 接近 极 小 后 
的 位 置 ， 由 于 锯齿 现象 使 每 次 迭代 行进 的 距离 缩短 ， 因 而 收敛 速度 减 慢 。 这 种 情况 
似乎 与 “最 速 下 降 ” 的 名 称 相 矛 盾 ， 其 实 不 然 ， 这 是 因为 梯度 是 函数 的 局 部 性 质 。 
从 局 部 上 看 ， 在 一 点 附近 函数 的 下 降 是 快 的 , 但 从 整体 上 看 则 走 了 许多 玖 路， 因此 
聘 数 的 下 降 并 不 算 快 。 














X2 


图 4-1 ”最速 下 降 法 的 搜索 路 径 
若 将 4. 10 节 例 4-1 中 的 目标 函数 A 对 ) =x? +25 x2 引 入 变换 


y1 = Xi 
y» =5 %2 
则 函数 信和 耻 ) 变 为 
J(Y) = 7) +3 
其 等 值 线 就 由 一 族 椭圆 (图 42) 变 成 一 族 同心 圆 (图 4-3), 仍 从 X" = 
(2,2) 即 YYV = (2,10) "出 发 进行 最 速 下 降 法 寻 优 。 此 时 有 
y(¥'") =104 


Vi(Y®) | | 





20 





图 4-2 等 值 线 为 椭圆 的 迭代 过 程 
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图 4-3 ”等 值 线 为 圆 的 迭代 过 程 


沿 负 梯 度 - Vw(Y"” ) 方 向 进行 一 维 搜索 ， 有 
ME = 六 (0) 二 Vy(Y'™) 


人 2 
li 5 | 
wa" 为 一 维 搜索 最 佳 步 长 ， 可 由 极 值 条 件 算出 
y( 了 = miny( Y'™ a Vy( 0 =minB (a ) 
Ba)=(24a00) +(10-200%) 
BD'(a = -8(2-4a0) -40(10 -20aw'0) =0 
0 2- 
52 
从 而 算得 第 一 次 走 步 后 设计 点 的 位 置 及 其 相应 的 目标 函数 值 为 


2-4a”\， 10 
了 


0. 3 








y(Y™ ) =0 

可 见 经 过 坐标 变换 后 ， 只 需 经 过 一 次 欠 代 ， 承 可 找到 最 优 解 
X*=(0,0)" 
/(X ) =0 


比较 以 上 两 种 函数 形式 


0 rma 9 


0 2/\y, 
可 以 看 出 它们 中 间 的 对 角形 矩阵 不 同 ， 同 时 站 ) 的 等 值 线 为 一 族 椭圆 ， 而 y(7Y) 的 
等 值 线 为 一 族 同 心 圆 。 这 是 由 于 经 过 尺度 变换 


nt 
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i i 

y» =5 %, 
妈 wx, 轴 的 度量 不 变 ， 而 把 x, 轴 的 度量 放大 5 倍 ， 从 而 把 等 值 线 由 椭圆 变 成 加 了 ， 
这 说 明 上 面 两 个 二 次 型 函数 的 对 角形 和 矩阵 刻画 了 椭圆 的 长 、 短 轴 ， 它 们 是 表示 度量 
的 矩阵 或 者 是 表示 尺度 的 矩阵 。 最 速 下 降 法 的 收敛 速度 和 变量 的 尺度 关系 很 大 ， 这 
一 点 可 从 最 速 下 降 法 收敛 速度 的 估计 式 上 看 出 来 。 在 适当 条 件 下 ， 有 


x" -x <(1 -mm)lx® -xX"| (4-4) 
式 中 ，WM 为 八 站) 的 黑 塞 和 矩阵 最 大 特征 值 上 界 ; m 为 其 最 小 特征 值 下 界 。 
2 0 
对 于 等 信 线 为 椭圆 的 二 次 型 函数 作 X) = 邓 +25 号 ， 其 黑 塞 重 阵 召 =|。 50|， 


0 30 
两 个 特征 值 分 别 为 A =2, A,=50 。 因 此 普 =2，M =50， 从 而 有 
2° 624 
(kK+1) _ * 1 一 (k) _ Vi* = (Kk) * 
上 < -x1=6551X" -Xx"| 


可 见 等 值 线 为 椭圆 的 长 、 短 轴 相 差 越 大 ， 收 敛 就 越 慢 。 而 对 等 值 线 为 圆 的 二 次 
2 0 
函数 (FY) = +， 其 黑 塞 短 阵 五 = | 0 | 两 个 特征 值 相等 ， 即 A, = 和, =2， 


此 m=M=2， 将 其 代入 式 (4-4) ， 有 
[Be 二 1<0 
得 y+ = 

即 经 过 一 次 迭代 便 可 达到 极 值 点 。 

当 相 邻 两 个 迭代 点 之 间 满 足 关系 式 (4-4) 时 (右边 的 系数 为 小 于 等 于 1 的 正 
和 常数) ， 我 们 称 相 应 的 迭代 方法 是 具有 线性 收敛 速度 的 迭代 法 。 因 此 ， 最 速 下 降 法 
是 具有 线性 收敛 速度 的 迭代 法 。 

最 速 下 降 法 是 一 个 求解 极 值 问题 的 古老 算法 ， 早 在 1847 年 就 已 由 柯 西 
(Cauchy) 提出 。 此 法 直观 、 简 单 。 由 于 它 采 用 了 困 数 的 负 梯 度 方 回 作为 下 一 步 的 
搜索 方向 ， 所 以 收敛 速度 较 慢 ， 越 是 接近 极 值 点 收敛 越 慢 ， 这 是 它 的 主要 缺点 。 应 
用 最 速 下 降 法 可 以 使 目标 函数 在 开头 几 步 下 降 很 快 ， 所 以 它 可 与 其 他 无 约束 优化 方 
法 配合 使 用 。 特 别 是 一 些 更 有 效 的 方法 都 是 在 对 它 改 进 后 ， 或 在 它 的 局 发 下 获得 
的 ， 因 此 最 速 下 降 法 仍 是 许多 有 约束 和 无 约束 优化 方法 的 基础 。 

4.2.2 和 迭代 过 程 及 算法 框图 
最 速 下 降 法 的 迭 过 程 如 下 : 
1) 给 定 初 值 际 ”、 收 敛 精度 e 和 计算 次 数 大 =0。 


2) 令 计算 次 数 上 = 上 +1， 计 算 负 梯 度 - W(X”)。 
3) 计算 天 = 下 -ae V1 CE) 求解 /(X*)=minf[X®” -ao V/ 
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(XW )], 求 得 a 。 

4) 判断 对“*” -Xe<e,“ 是 ” 则 收 僵 ,输出 对 ”= 了 "* 和 函数 值 f(X*)， 
否则 转 入 步骤 2)。 

按 此 迭代 过 程 的 程序 框图 如 图 4-4 所 示 。 















XHD) YO+roDdgD 
co:minfCxw+aDSW) 


Xe XD 


图 4-4 最速 下 降 法 算法 的 程序 框图 
4.3 ”牛顿 型 方法 


4.3.1 基本 原理 


1. 原始 牛顿 法 
原始 牛顿 法 的 基本 原理 是 : 原 目 标 函 数 f( 半 ) 用 在 迭代 点 ” 邻 域 展 开 的 泰勒 
二 次 多 项 式 wp( 导 ) 去 近似 代 蔡 ， 再 以 p( 导 ) 这 个 二 次 函数 的 极 小 点 革 ; 作 为 原 目标 函 




















困 数 大半 ) 的 极 小 点 于 ”。 
二 次 明 近 男 数 w(X) 可 写成 
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p(X) =) +[ WE )]?( 站 -于 0 ) + XX HY) (X-X") AX) 


(4-5) 

式 中 ，W(X%)、 及 (X ) 分 别 为 原 目标 函数 /(X) 在 X 点 的 梯度 和 黑 塞 
矩阵。 

p(X) 的 极 小 点 X; 可 由 极 值 存在 的 必要 条 件 ， 今 其 梯度 Vp(X) =0 来 求 得 ， 
亦 即 





Vep(X ) = VIX")+H(X")(X-X")=0 


这 样 ， H(X'™”)(X-X")=- V(X") 
若 瑟 ( 导 9 ) 为 可 首 和 矩阵， 将 上 式 等 号 两 边 左 乘 以 [ 豆 (X2 ) ] ， 则 得 
XX EL YE) (4-6) 
将 XX 取 作 下 一 个 优化 适 代 点 于 40 ， 即 可 得 到 原始 牛顿 法 的 迭代 公式 为 
CE) WR (477) 
由 式 (4-7) 可 知 原始 牛顿 法 的 搜索 方向 为 
So==[H(X I VX) (4-8) 








这 个 方向 称 为 牛顿 方向 。 由 式 (4-7) 还 可 看 到 迭代 公式 中 没有 步 长 因子 a ， 
所 以 原始 牛顿 法 是 一 种 定 步 长 的 搜索 迭代 。 
2. 阻尼 牛顿 法 
为 消除 原始 牛顿 法 的 上 述 粹 病 ， 对 其 加 以 改进 ， 提 出 了 “阻尼 牛顿 法 ”。 阻 尼 
牛顿 法 每 次 迭代 方向 仍 采 用 式 (4-8) 表达 的 牛顿 方向 8 ， 但 每 次 迭代 需 沿 此 方 
向 作 一 维 搜索 ， 求 其 最 优 步 长 因子 xa” ， 即 
RE 十 AN . 二 minf( ¥'" 十 RS ) 
将 原始 牛顿 法 的 迭代 公式 修改 为 
+ 二 守信 i 可 多 [HC(X'™ ) ] -1 Wi ) (4-9 ) 
此 即 牛 顿 法 的 迭代 公式 。 式 中 ，a™” 称 为 阻尼 因子 ， 是 通过 沿 牛 顿 方向 一 维 搜索 寻 
优 而 得 。 当 目标 函数 成 革 ) 的 黑 赛 矩阵 吾 (X 7 ) 处 处 正定 时 ， 阻 尼 牛 顿 法 能 保证 每 
次 迭代 点 的 孔 数 值 均 有 所 下 降 ， 从 而 保持 了 二 次 收敛 的 特性 。 


4.3.2 和 迭代 过 程 及 算法 框图 


阻尼 牛顿 法 的 具体 迭代 步 又 如 下 : 

1) 给 定 初始 点 于 <sR" 、 和 迭代 精度 =、 维 数 n。 

2 ) Sh 

3) 计算 ”点 的 梯度 W(X ) 及 其 模 | V(X) 1。 

4) 检验 是 否 满足 迭代 终止 条 件 上 V(X" ) 上 es。 若 满 足 停止 迭代 ， 输 出 最 优 
解 : 不” =X ，f(X"”) =f(X"); 否则 ， 进 行 下 一 步 。 

5) 计算 于 ”处 的 黑 塞 矩 阵 五 (X"”) ， 并 求 其 道 矩 阵 [ 鼠 (X 7 )] 。 
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6) 确定 牛顿 方向 5% = [ 责 (XO )] WX )， 沿 8 方向 进行 一 维 搜索 求 最 
优 步 长 at 六 十 Ce ) 十 minf (XE 十 人 ) 有 

7) 计算 迭代 新 点 0 = ta 中 S 中 。 

8) 置 上 +1 坟 返回 步骤 3) 进行 下 一 次 送 代 计算 。 

阻尼 牛顿 法 的 算法 框图 如 图 4-5 所 示 。 


给 定 Xe 










计算 VX) YACKO) 







否 


计算 [HX 中)] 
TA VR SI 


求 ct9 合 
f(x (Do SO)=minf (XO+ cx) 


XOroaDgD Sx 


图 4-5 阻尼 牛顿 法 的 算法 框图 








输出 : 关中 过 XX 
f(X®) 7 ") 






4.4 共 斩 方 向 法 





为 了 克服 最 速 下 降 法 的 锯齿 现象 以 提高 其 收 剑 速度， 发展 了 一 类 共 因 方 癌 法 。 
由 于 这 类 方法 的 搜索 方向 取 的 是 共 斩 方 向， 因此 先 介 绍 共 斩 方 回 的 概念 和 性 质 。 
4.4.1 基本 原理 

1. 共 力 方向 的 概念 

共 斩 方 向 的 概念 是 在 研究 二 次 函数 

f(X) = 5X'GX +hb'X+c (4-10) 

(G 为 对 称 正定 和 矩阵) 时 引出 的 。 本 节 和 以 后 几 市 所 介绍 的 方法 有 一 个 共同 的 特 
点 ， 就 是 首先 以 式 (4-10) 的 二 次 函数 为 目标 孔 数 给 出 有 关 算 法 ， 然 后 青 把 算法 推 
广 到 一 般 的 目标 孔 数 中 去 。 

为 了 直观 起 见 ， 痛 先 考 虑 二 维和 情况 。 二 元 二 次 函数 的 等 值 线 为 一 族 椭圆 ， 任 选 
初始 点 ” 沿 某 个 下 降 方 向 SW 作 一 维 搜索 ， 得 
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对 (1 二 万 (0) 下 
因 a 中 是 沿 5 中 方向 搜索 的 最 佳 步 长 ， 即 在 X 点 处 函数 f(X) 沿 5 方向 的 方向 导数 
为 零 。 
考虑 到 XX 点 处 方向 导数 与 梯度 之 间 的 关系 ， 故 有 

ll WO (4-11) 
式 中 ，S' 与 某 一 等 值 线 相 切 于 XX 
点 。 下 一 次 迭代 ， 如 果 按 最 速 下 降 
法 ， 选 择 负 梯度 - VA (Xm) 方向 为 
搜索 方向 ， 则 将 发 生 锯齿 现象 。 为 
避免 锯齿 的 发 生 ， 我 们 可 取 下 一 次 
的 迭代 搜索 方向 5S 直 指 极 小 点 不 * ， 
如 图 4-6 所 示 。 如 果 能 够 选 定 这 样 的 - 
搜索 方向 ， 那 么 对 于 二 元 二 次 函数 ”“ 
只 需 顺 次 进行 S' 0 、S4) 两 次 直线 搜 图 4-6 共 轿 方向 的 搜索 方向 
索 就 可 以 求 到 极 小 点 ¥"， 即 有 














0(0) gO0) OD 








XR* = +a us 
式 中 ,a 为 $m 方向 上 的 最 佳 步 长 。 
那么 这 样 的 S$ 方向 应 该 满足 什么 条 件 呢 ?” 对 于 由 式 (4-10) 所 表示 的 二 次 函 
数 作 对) 有 
V(XV)=GX +b 
当 ' 闫 著 "时 ， 取 a 关 0， 由 于 对 “是 函数 A 和 XX) 的 极 小 点 ， 应 满足 极 值 必要 条 
件 ， 故 有 
V(X*)=GX* +b=0 
V(X"*) eM V(X ) +avGS =0 
将 等 式 两 边 同 时 左 乘 (S' ) "， 并 注意 到 式 (4-11) 和 a'™n 关 0 的 条 件 ， 得 
(SV)'GS' =0 (a 
这 就 是 为 使 S$ 直 指 极 小 点 "、S'n 所 必须 满足 的 条 件 。 满 足 式 (4-12) 的 两 
个 向 量 S”、S 称 为 共 思 向量。 或 称 S””、S' 是 共 力 方向 。 
2. 共 力 方向 的 性 质 
定义 ” 设 G 为 n xn 对称 正 定 矩 阵 ， 若 nn 维 空间 中 有 m 个 非 零 向 量 S") 、S'、 
wi IO ST) 
满足 





(SITGSO =0 (i,j=0,1,2,.…,m—1;i)) (4-13) 
则 称 SW、SW、…、S'” 对 G 共 轿 ， 或 称 它们 是 G 的 共 思 方 向 。 
当 G= 了 (单位 矩阵) 时 , 式 (4-13) 变 成 
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ee 
即 向 量 S0) 、$80) 、…、8 互相 正 交 。 由 此 可 见 ， 共 生 概 念 是 正 交 概念 的 推广 ， 
正 交 概念 是 共 斩 概 念 的 特例 。 

性 质 1 若非 零 向 量 系 SH 、S0) 、…、8S( 是 对 G 共 轿 的 ， 则 这 m 个 向 量 是 
线性 无 关 的 。 

性 质 2 在 n 维 空间 中 互相 共 罗 的 非 零 向 量 的 个 数 不 超 过 n。 

性 质 3 ”从 任意 初始 点 对" 出 发 ， 顺 次 沿 G 的 苍 方向 5 中 、S、…、S"， 
进行 一 维 搜索 ， 最 多 经 过 n 次 迭代 就 可 以 找到 由 式 (4-10) 所 表示 的 二 次 函数 / 
(X) 的 极 小 点 XY"。 

此 性 质 表 明 这 种 迁 代 方法 具有 二 次 收敛 性 。 


4.4.2 迁 代 过 程 及 算法 框图 


共 斩 方 向 法 是 建立 在 共 斩 方 向 性 质 3 的 基础 上 的 ， 它 提供 了 求 二 次 函数 极 小 点 
的 原则 方法 。 其 步骤 是 : 

1) 选 定 初始 点 对”、 下 降 方 向 SW 和 收敛 精度 。， 置 fh-0。 

2) 沿 SW 方 向 进行 一 维 搜索 ， 得 ¥“"* ”=X ta SS。 

3) 判断 | VAX “5 )| <e 是否 满足 ， 若 满足 ， 则 输出 X**”， 结 束 ， 否 则 转 4)。 

4) 提供 新 的 共 轿 方向 5"??, 使 (SY”)'GS™**Y =0,j=0, 1, 2, …, kk。 

5) 置 fhe-hk+1， 转 2)。 

共 斩 方 向 法 的 程序 框图 如 图 4-7 所 示 。 提 供 共 斩 向 量 系 的 方法 有 许多 种 ， 从 而 
形成 各 种 具体 的 共 斩 方 向 法 ， 如 共 斩 梯 度 法 、 鲍 威 尔 法 等 ， 这 些 方法 将 在 下 面 几 节 
予以 讨论 。 

这 里 首先 介绍 格拉 姆 - 施 密 特 (Gram-Schmidt) 向 量 系 共 斩 化 方法 ， 它 是 格拉 
姆 - 施 密 特 向 量 系 正 交 化 方法 的 推广 。 

设 已 选 定 线性 无 关 向 量 系 yo。、vi、…、v,_1，( 例 如 ， 它 们 是 n 个 坐标 轴 上 的 单 


位 癌 量 ), 令 














SG 0) = 
GD) =y) +BioS'™ 
其 中 Bi 是 待定 系数 ， 它 根据 S$ 与 $S"" 共 斩 条 件 来 确定 ， 即 
(S™) GS =(S™)"G(y, +BiS'™ ) =0 
(SG 
加 (SS® )'G S00) 














Bio 二 

从 而 求 得 与 $") 共 恩 的 
(SO)IGm 
加 (人 ) iG SG 0) 
设 已 求 得 共 箔 向 量 $0) 、$S 7) 、… 、S ， 现 求 S“ 7) 。 令 





S 40) 
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给 定 和 (0)、 SC0)、 £ 






XDYXV+ra WgD 


or :minf (XW+os®) 
CU 


提供 新 的 共 思 方 向 





图 4-7 共 轿 方向 法 的 程序 框图 


k 
人 V+ > Bid 
r=0 
为 使 5 与 S” (1 =0,1,2,… 光 ) 共 罗 ， 应 有 
k 
(SD)GSYD = (SH)G (pin + 2 Bri S| =0 
由 此 解 得 








(S2 )7G byl 
Oi (S™ jG GO) (4 
于 是 
k (7)) \T 


(kK+1) 
S 二 2 (SO TITG SO) 


4.5 葵 梯度 法 


4.5.1 基本 原理 
共 斩 梯 度 法 是 共 箔 方向 法 中 的 一 种 ， 因 为 在 该 方法 中 每 一 个 共 斩 回 量 都 是 依赖 
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于 迭代 点 处 的 负 梯 度 而 构造 出 来 的 ， 所 以 称 作 共 恩 梯度 法 。 为 了 利用 梯度 求 共 恩 方 
向 ， 我 们 首先 来 研究 共 力 方向 与 梯度 之 间 的 关系 。 
考虑 二 次 函数 





f(X) = 3X'GX +bX+c 


从 XX ”点 出 发 ， 沿 G 的 某 一 共 轿 方向 5” 作 一 维 搜索 ， 到 达 X"* 点 ， 即 


ED STO FG 


EtD) LT oH SY 
而 在 X”、X “点 处 的 梯度 VX ) 、VAE  ) 分 别 为 
V(X”)=GX"+b 
VR 二 人 系 (+1) +Db 


所 以 有 
VE) - VIX®)=G (XY -XxX )=a" GS (4-16) 
若 S” 和 3S$…” 对 G 是 共 罗 的 ， 则 有 (3 ) GS ”=0 
利用 式 (4-16) 对 两 端 左 乘 (S”) 即 得 
Le ee (4-17) 


这 就 是 共 斩 方 向 与 梯度 之 间 的 关系 。 此 式 表明 沿 方向 8 进行 一 维 搜索 ， 其 终 
点 全 "与 始点 ”的 梯度 之 差 V(X ) - VE ) 与 $S ”的 共 斩 方 向 8” 正 交 。 
共 斩 梯 度 法 驶 是 利用 这 个 性 质 做 到 不 必 计 算 和 矩阵 G 就 能 求 得 共 轿 方向 的 。 此 性 质 
的 几何 说 明 如 图 4-8 所 示 。 





V/CX®) 






SD 


V/V D) 
SD 


图 4-8 共 轿 梯度 法 的 几何 说 明 


4. 5.2 ”和 迭代 过 程 及 算法 框图 


共 固 梯度 法 的 计算 过 程 如 下 : 
1) 设 初始 点 '”， 第 一 个 搜索 方向 取 X' 点 的 负 梯 度 - V(X")， 即 
Se VE) (4-18) 


第 4 章 ”无 约束 优化 方法 | 49 


沿 SM 进行 一 维 搜索 ， 得 ”= 于 +a SY 并 算出 中 点 处 的 梯度 V/A(X)， 
XX 中 是 以 S$ 为 切线 和 某 等 值 曲线 的 切 点 。 根 据 梯度 和 该 点 等 值 面 的 切面 相 垂 直 的 
性 质 ， 因 此 VA(X" ) 和 SS” 正 交 ， 有 (SW ) VA/(X ) =0， 从 而 S* ”、S%W 正 交 ， 
即 (SW)"SW =0,，S' 和 SW 组 成 平面 正 交 系 。 

2) 在 SW” 、W(X' ) 所 构成 的 平面 正 交 系 中 求 $% 的 共 斩 方 向 8 ， 将 其 作为 
下 一 步 的 搜索 方向 。 把 Sm 取 成 - W(X ) 与 9$% 两 个 方向 的 线性 组 合 ， 即 

SO = VXV)+BS" 

式 中 ，B 为 待定 常数 ， 它 根据 共 斩 方向 与 梯度 的 关系 求 得 。 

由 [SS = -0 
有 (- V(X) +BS™)(S -S$S™)=0 

将 此 式 展开 ， 考虑 到 ( - WX”))'S® =0, 即 ( -VXY))'(- VX™))=0 
可 求 得 





gC VXO) T= XO) | WX 
(WO VX) | WX) 
SO) - yx | VE ) 上 wo) 
ET 
沿 S 方向 进行 一 维 搜索 得 于 ”= +a0 So 并 算出 该 点 梯度 
VA(X'“"),， 有 








(SEO 
故 有 (- VOX") +BoS ) VE ) =0 (4-19 ) 
SW 和 S' 共 轧 ， 根 据 共 粥 方向 与 梯度 的 关系 式 (4-17) 有 
(SV) VX™)- VOIX))=0 
考虑 到 (Sw) ”V/A(X"  ) =0,， 因此 (S$) VA(X )=0,， 即 VA(CXE2 ) 和 
VA(X"W ) 正 交 ， 又 根据 式 (4-19) 得 ( VE )) VE ) =0， 即 V(X'”) 和 
VAXW ) 正 交 ， 由 此 可 知 ，VAXW ) 、VED ) 、VE2”) 构 成 一 正 交 系 。 
3) 在 V(X)、VAX'W")、VA(XW) 所 构成 的 正 交 系 中 , 求 与 $W 和 Sm 均 
共生 的 方向 8 。 
设 Se V/(X'™) + Yi VCE + Yo VE 
式 中 ，y1 、Yo 为 待定 系数 。 
因为 要 求 $ 与 5 和 S' 均 巷 ， 根 据 式 (4-17) 共 斩 方 向 与 梯度 的 关系 ， 有 
(- VIX) +y VIX ) +tyo VOX))( VX )- VOIX))=0 
(- VOX) +y VEX ) +yo VX)) VE) - WX))=0 
考虑 到 VX ) 、VED ) 、VHE2 ) 相 互 正 交 ， 从 而 有 
yi VE )) VEX ) -yl VE)) VX™)=0 
- (VX)) VE ) -yl VOIX)) VX)=0 








因此 
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S = - VX™)+y VX ) +yo VX ) 
=- - VX) -B VXY) -BB VX®) 
Be 
二 上 VHF( 2) ) +BiS'" 

从 而 得 出 SY = - WAX ) + 
再 沿 $” 方 向 继续 进行 一 维 搜索 ， 如 此 继续 下 去 可 求 得 共 斩 方 向 的 递 推 公式 为 
i | VX )) 
SHED -= WX ) + 1 
沿 厦 这 些 共 斩 方 向 一 直 搜 索 下 去 ， 直 到 最 后 迭代 点 处 梯度 的 模 小 于 给 定 人 允许 人 
为 止 。 奋 目标 函数 为 非 二 次 函数 ， 经 n 次 搜索 还 未 达到 最 优点 时 ， 则 以 最 后 得 到 的 
点 作为 初始 点 ， 重 新 计算 共 斩 方 向 ， 一 直到 满足 精度 要 求 为 止 。 
共 斩 梯 度 法 的 程序 框图 如 图 4-9 所 示 。 


k—0 
Se WA 1) 


XHDe NODgD 
a: minf (XHO+o NSD) 
元 网 


V(X) 








SY) (k=0,1,2,.…,n-1) 

























S > 
< 


1vfG DD) 


绎 有 
结 来 ve 


XO XD 


SED yf)BS® 





图 4-9 ” 共 轿 梯度 法 的 程序 框图 


上 述 共 绒 梯度 法 是 1964 年 由 弗 来 彻 (Fletcher) 和 里 伍 斯 (Reeves) 两 人 提出 
的 。 此 法 的 优点 是 程序 简单 ， 存 储量 少 ， 具 有 最 速 下 降 法 的 优点 ， 而 在 收敛 速度 上 
比 最 速 下 降 法 快 ， 具有 二 次 收敛 性 。 
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4.6 ” 变 尺度 法 


4.6.1 基本 原理 


1. 尺度 矩阵 的 概念 
变量 的 尺度 变换 是 放大 或 缩小 各 个 坐标 。 通 过 尺度 变换 可 以 把 函数 的 偏心 程度 
降低 到 最 低 限度 。 尺 度 变换 技巧 能 显著 地 改进 几乎 所 有 极 小 化 方法 的 收敛 性 质 。 如 
在 例 4-1 中 用 最 速 下降 法 求 凡 EX) =xi +25 x; 的 极 小 值 时 ， 需 要 进行 10 次 迭代 才能 
达到 极 小 点 ”= (0,0)'。 但 是 若 做 变换 
yi1 =Xil 
》 2 =5 2 
即 把 x, 的 尺度 放大 5 倍 ， 就 可 以 将 等 值 线 为 椭圆 的 函数 f( 半 ) 变换 成 等 值 线 为 圆 的 
函数 yy( 了 ) =yY +X 从 而 消除 了 函数 的 偏心 ， 用 最 速 下 降 法 只 需 一 次 迭代 即 可 求 得 
极 小 点 。 
对 于 一 般 二 次 函数 





f(X) = FX'GX +bX+c 


如 条 进 行 广度 变换 
Xe—OX 
则 在 新 的 坐标 系 中 ， 函 数 太 和 半 ) 的 二 次 项 变 为 
FX'GX »X"Q"GOX 


选择 这 样 变换 的 目的 ,仍然 是 为 了 降低 二 次 项 的 偏心 程度 。 寿 矩阵 G 是 正定 
的 ， 则 总 存在 矩阵 使 





Q GQ =7( 单 位 和 矩阵) 





从 而 将 函数 偏心 度 变 为 零 。 
用 O- 右 乘 上 述 等 式 两 边 ， 得 


Q'G=0" 
然后 用 Q 左 乘 上 述 等 式 两 边 ， 得 

00'G =1 

0Q0"=G" 








这 说 明 二 次 函数 矩阵 G 的 逆 矩 阵 ， 可 以 通过 尺度 变换 矩阵 8 来 求 得 。 这 样 ， 
牛顿 法 迭代 过 程 中 的 牛顿 方向 便 可 写成 
S =-G WX")= -QQ VX™) 
例如 在 例 4-1 中 ， 二 次 函数 
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A = 5 0 (2 | -2ex 














0 50 2 
其 中 
2 0 
ee 
若 取 
a 
2 2 
0 1 
5 /2 
的 变换 X< OK 
则 在 变换 后 的 坐标 系 中 ， 和 矩阵 G 变 为 
下 涌 一 
rop -| 2 2 .01| 02 0 
. le | | 路- 
5 2 3 
从 而 求 得 
A 0 2 0 0 
人 有 和 2 2 _ 2 
ee | | 二 王 
5 sy 50 
这 与 在 例 4-1 中 所 得 结果 一 致 ， 而 且 只 需 通 过 一 次 迭代 即 可 求 得 极 小 点 承 * 


(0,0) 和 极 小 值 fX*) =0。 
比较 牛顿 法 迭代 公式 
和 +) 二 万 (的 -at0O0: VA ) 
和 梯度 法 迭代 公式 
对 二 对 中 a VR) 
可 以 看 出 ， 差 别 在 于 牛顿 法 中 多 了 QQ 部 分 。Q0Q 实际 上 是 在 空间 内 测量 距离 大 
小 的 一 种 度量 ,， 称 作 尺 度 和 矩阵 M: 














M=00 
如 在 未 进行 尺度 变换 前 ， 癌 量 耻 长 度 的 概念 是 
习 | > 





变换 后 向 量 下 对 于 M 尺度 下 的 长 度 
上 ZK = [COZD7COZ) =[DE(OOTD)X] = (XMY )? 
这 样 的 长 度 定义 ， 在 确定 “长 度 ” 这 个 纯 量 大 小 时 ， 使 得 某 些 方向 起 的 作用 
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比较 大 、 画 一 些 方向 起 的 作用 比较 小 。 为 使 这 种 太 度 有 用 ， 必 须 对 一 切 非 零 问 量 的 
革 均 有 XX MX >0， 即 要 求 尺度 矩阵 M 正定 。 既 然 牛 顿 法 迭代 公式 可 用 尺度 变换 拢 
阵 M=QQ 表示 出 来 ， 即 

XE =XOD a dM VE) 

它 和 梯度 法 迭代 公式 只 差 一 个 太 度 矩阵 M， 那么 牛顿 法 就 可 看 成 是 经 过 尺度 
变换 后 的 樟 度 法 。 经 过 矿 度 变换 ， 使 本 数 俩 心率 减 小 到 零 ， 郴 数 的 等 值 面 变 为 球 
面 ( 或 超 球面 )， 使 设计 空间 中 任意 点 处 函数 的 梯度 都 通过 极 小 点 ， 用 最 速 下 降 
法 只 需 一 次 六 代 就 可 达到 极 小 点 。 这 就 是 对 变换 前 的 二 次 了 凶 数 ， 在 使 用 牛顿 方法 
时 ， 由 于 其 牛顿 方向 直接 指向 极 小 点 ， 因 此 只 需 一 次 迭代 就 能 找到 极 小 点 的 原因 
所 在 。 

2. 变 尺度 和 矩阵 的 建立 

对 于 一 般 函 数 作 对) ， 当 用 牛顿 法 寻求 极 小 点 时 ， 其 牛顿 迭代 公式 为 

RD RO WR) (R02 

为 了 避免 在 适 代 公 式 中 计算 黑 塞 矩 阵 的 逆 矩 阵 ( 豆 ”) ”， 可 用 在 迭代 中 逐步 建 

立 的 变 尺 度 和 矩阵 














MD =M(X") 
来 替换 ( 吾 “) ”， 即 构造 一 个 矩阵 序列 …} 来 逼近 黑 塞 道 矩阵 序列 |( 豆 ” ) 1， 
每 迭代 一 次 矿 度 驶 改变 一 次 ， 这 正 是 “ 变 矿 度 ” 的 含义 。 这 样 ， 上 式 变 为 
Xe mM YX) hal) (4-20) 
其 中 a 是 从 XX 出 发 ， 沿 方向 
SO = -MO V(X) 

做 一 维 搜索 而 得 到 最 佳 步 长 。 这 个 迭代 公式 代表 面 很 广 ， 例 如 当 M ”” =T (单位 矩 
阵 ) 时 它 就 变 成 最 速 下 降 法 。 以 上 就 是 变 尺 度 法 的 基本 思想 。 

为 了 使 变 尺度 矩阵 M" 确实 与 (H") ”近似 ， 并 具有 容易 计算 的 特点 ， 必 须 对 
M ”附加 某 些 条 件 。 


4. 6.2 迁 代 过 程 及 算法 框图 


1) 选 定 初始 点 丸和 收敛 精度 e; 

2) 计算 WX ) ， 选 取 初 始 对 称 正 定 矩 阵 M'() ， 如 M0 =7 

3) 计算 搜索 方向 ，$S = -MO V(X ) 

4) 沿 S$… 方 向 进行 一 维 搜索 ， 计 算 Vf ( 人 )，8 7 =X0 1? 一 下 = 
WURE = V(X): 

5) 判断 是 否 满 足 迭 代 终 止 准则 ， 和 车 满足 对 ”= 了 “*”， 则 结束 ， 否 则 转 6); 

6) 当 和 迭代 nn 次 后 还 没 找到 极 小 点 时 ， 重 置 M” 为 单位 矩阵 工 并 以 当前 设计 
点 入 对 “为 初始 点 ， 返 回 到 2) 进行 下 一 轮 迭 代 ， 否 则 转 到 7); 

7) 计算 矩阵 M ”= 3 +E 置 he 和 +1 返回 到 3)。 
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对 于 校正 矩阵 如 “可 由 具体 的 公式 来 计算 ， 不 同 的 公式 对 应 不 同 的 变 尺度 法 ， 

将 在 下 面 进行 讨论 。 但 不 论 哪 种 变 尺度 法 E" 必须 满足 拟 牛 顿 条 件 
MU Dy® =z0 

即 (MD +E )y® = 
i EDy® =z0D MOy® 

满足 上 式 的 E'” 有 无 穷 多 个 ， 因 此 上 述 变 尺度 法 (属于 拟 牛 顿 法 ) 构成 一 族 
算法 。 

变 尺度 法 的 计算 程序 框图 如 图 4-10 所 示 。 











| 给 定 xs 
















计算 go 一 VHCXK(O)， 选 取 
MO 一 7 


SO MOV CU) 


XID 和 ODS 
cw: minf(XHO+o Ms) 
pA) 










UY) 


grr VI TY)) 
大 
pO gr-B 


XM) XD SO XID x 


MED MOLED 


图 4-10 ” 变 尺 度 法 的 计算 程序 框图 
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4.6.3 ”DFP 算法 


在 变 尺度 法 中 ， 校 正和 矩阵 E 取 不 同 的 形式 ， 就 形成 不 同 的 变 尺度 法 。DFP 算 
法 中 的 校正 矩阵 E'" 取 下 列 形式 : 
E'® NAA A By (4-21) 
其 中 uw 路 、v 中 是 nn 维 待 定向 量 ; qa、B 中 是 待定 常数 ，w 中 (ww) (7 ) 是 
对 称 秩 一 的 矩阵 ， 它 们 可 以 说 是 一 种 最 简单 的 矩阵。 
根据 校正 矩阵 E* 要 满足 拟 牛 顿 条 件 
Ry 二 了 (已 1 人 
则 有 (Cau (wu be +B Op (p® )T)y = 一 IO 
Ba Vw'® (u'® yy BD (p'® yy 二 zz = 
满足 上 面 方程 的 待定 向 量 w“ 和 v'“ 有 多 种 取 法 ， 我 们 取 
站 (了 和 二 zz 
B' Iv (pv'® yy =M yy'® 


注意 到 (ze ) 了 、(7”) ”都 是 数量 ， 不 妨 取 
(1) (有 














US 
vy = MYOy® 
这 样 就 可 以 定 出 
CR 1 
全 (zy 
1 
B® 
(y My® 


从 而 可 得 DFP 算法 的 校正 公式 为 
(k) (k) NT (k) ,Ck) (k) TAA Ek) 
oat a 

DFP 算法 的 计算 步骤 和 变 尺度 法 的 一 般 步 又 相同 ， 只 是 具体 计算 校正 矩阵 时 应 
按 上 面 公式 进行 。 

当初 始 和 矩阵 MM'" 选 为 对 称 正定 矩阵 时 ，DFP 算法 将 保证 以 后 的 迭代 和 矩阵 M” 都 
是 对 称 正定 的 ， 即 使 将 DFP 算法 施用 于 非 二 次 函数 也 是 如 此 ， 从 而 保证 算法 总 是 
下 降 的 。 这 种 算法 用 于 多 维 问题 (如 20 个 变量 以 上 ) ， 收 敛 速度 快 ， 效 果 好 。DFP 
算法 是 无 约束 优化 方法 中 最 有 效 的 方法 之 一 ， 因 为 它 不 单纯 是 利用 向 量 传递 信息 ， 
还 采用 了 和 矩阵 来 传递 信息 。DFP 算法 是 戴 维 登 ( Davidon) 于 1959 年 提出 的 ， 后 来 
由 弗 来 彻 (Fletcher) 和 鲍威尔 (Powell) 于 1963 年 做 了 改进 ， 故 用 三 人 名 字 的 第 
一 个 字母 命名 。 

DFP 算法 由 于 舍 和 人 误差 和 一 维 搜索 不 精确 ， 有 可 能 导致 M 奇 异 ， 而 使 数值 稳 
定性 方面 不 够 理想 。 所 以 1970 年 提出 更 稳定 的 算法 公式 ， 称 作 BFGS ( Broyden- 


MY: 二 1469 十 
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Fletcher-Coldfarb-Shanno) 算法 ， 其 校正 公式 为 
MID -MD + (1 ja (OT MEY HT rH yD ya a )y® 
(4-23) 
因为 变 扩 度 法 的 有 效 性 促使 其 不 断 发 展 ， 所 以 出 现 过 许多 变 矿 度 的 算法 。1970 
年 芮 〈《Huang) 从 共 力 条 件 出 发 对 变 斥 度 法 做 了 统一 处 理 ， 写 出 了 统一 公式 
UD) oD mwCDMDYG 
= Q11 12 了 


E 下) (Eh E 下 ) (Eh 
p'® = oz ) +oa. M. “0 





并 取 
EE 二 了 (已 (了 2 ) 了 +M' Vy'® Cy ye 

可 以 看 出 ， 当 取 al =ai =0，al =a ，QW =B 中 时 就 是 DFP 算法 的 公式 。 

取 af =a4W? ，a4W =0 就 得 到 BFGS 算法 的 公式 。 

还 可 以 取 

uo 0 0a 

就 是 说 ， 对 a 站 赋值 不 同 即 可 得 到 不 同 变 尺度 算法 。 如 取 al? = a =0 时 得 麦 
考 密 克 (MecCormick) 算法 ; an = oi =0 即 得 皮尔 逊 (Pearson) 算法 等 。 





4.7 坐标 轮换 法 


坐标 轮换 法 是 每 次 搜索 只 允许 一 个 变量 变化 ， 其 余 变 量 保持 不 变 ， 即 沿 坐 标 方 
癌 轮 流 进行 搜索 的 寻 优 方法 。 它 把 多 变量 的 优化 问题 轮流 地 转化 成 单 变量 (其 余 
变量 视 为 第 量 ) 的 优化 问题 ， 因 此 也 称 这 种 方法 为 变量 轮换 法 ， 在 搜索 过 程 中 可 
以 不 需要 目标 函数 的 导数 ， 只 需 目 标 函 数值 信息 。 这 比 前面 所 讨论 的 利用 目标 函数 
导数 信息 建立 搜索 方向 的 方法 要 简单 得 多 。 


4.7.1 基本 原理 


以 二 元 函数 1 对) =f(xi ,x ) 为 例 说 明 坐 标 轮换 法 的 寻 优 过 程 ， 如 图 4-11 所 示 。 
从 初始 点 ”出 发 ， 沿 第 一 个 坐标 方向 搜索 ， 即 SIV =e 得 轴 ”= +al Si ， 按 
照 一 维 搜索 方法 确定 最 佳 步 长 因子 a 满足 :minf(X4? + a SW)， 然 后 从 X" 
出 发 沿 9 ”=e: 方 向 搜索 得 到 ”= 7 +a S$S3”。 其 中 步 长 因子 3 满足 : minf( XI 
+ad0 SW)， "为 一 轮 (k=0) 的 终点 。 检 验 始 、 终 点 间距 离 是 否 满足 精度 要 
求 ， 即 判断 XX”--X <s 的 条 件 是 否 满足 。 若 满足 则 和 "一半 ”， 否 则 令 X 
XI ， 重 新 依次 沿 坐 标 方向 进行 下 一 轮 (k=1) 的 搜索 。 

对 于 个 变量 的 函数 ， 若 在 第 轮 沿 第 i 个 坐标 方向 Sm 进行 搜索 ， 其 迭代 公 
式 为 
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Xs” = tar Se) (k=0,1,2,.,i=1,2,.",n) (4-24) 
其 中 搜索 方向 取 坐 标 方向 ， 即 St”=e;(i=1,2,…,n)。 若 上 X,” -Xo <e， 则 天 
一半， 否则 各 ?一半 ， 进 行 下 一 轮 搜 索 ， 一 直到 满足 精度 要 求 为 止 。 





X2 





XO-XU 





0O Xl 


图 4-11 坐标 轮换 法 的 搜索 过 程 


4.7.2 和 迭 代 过 程 及 算法 框图 


迭代 过 程 如 下 : 

1) 取 初 始点 对”、 收 敛 精 度 。、 维 数 n。 

2) 求 单 变量 极 值 问题 的 最 优 解 。 

3) 判断 是 否 满 足 i=n， 若 i=n， 则 转 4); 车 i<n， 则 令 i+1=>i， 转 到 2)。 

4) 检验 是 否 满足 精度 要 求 : 若 1X” -和 局” 1 大 se， 则 迭代 停止 ， 忌 ” 即 为 所 
求 ; 否则 ， 令 和 ”一 已” 转 2)。 

按 基本 原理 及 迭代 过 程 设计 出 如 图 4-12 所 示 的 程序 框图 。 

这 种 方法 的 收敛 效果 与 目标 函数 等 值 线 的 形状 有 很 大 关系 。 如 果 目 标 函 数 
为 二 元 二 次 函数 ， 其 等 值 线 为 圆 或 长 短 轴 平 行 于 坐标 轴 的 椭圆 时 ， 此 法 很 有 
效 。 一 般 经 过 两 次 搜索 即 可 达到 最 优点 ， 如 图 4-13a 所 示 。 如 果 等 值 线 为 长 短 
轴 不 平行 于 坐标 轴 的 椭圆 ， 则 需 多 次 迭代 才能 达到 最 优点 ， 如 图 4-13b 所 示 。 
如 果 等 值 线 出 现 疹 线 ， 本 来 沿 疹 线 方向 一 步 可 达到 最 优点 , 但 因 坐 标 轮换 法 总 
是 沿 坐 标 轴 方 向 搜索 而 不 能 沿 疹 线 搜索 ， 所 以 就 终止 到 痊 线 上 而 不 能 找到 最 
优点 。 

从 上 述 分 析 可 以 看 出 ， 采 用 坐标 轮换 法 只 能 轮流 沿 着 坐标 方向 搜索 ， 尽 管 
也 能 使 函数 值 步 步 下 降 ， 但 要 经 过 多 次 曲折 迁 回 的 路 径 才 能 达到 极 值 点 ; 尤其 
在 极 值 点 附近 步 长 很 小 ， 收 敛 很 乙 ， 所 以 坐标 轮换 法 不 是 一 种 很 好 的 搜索 方 
































58 ”| 机 械 优化 设计 与 实例 


法 。 但 是 ， 在 坐标 轮换 法 的 基础 上 可 以 构造 出 更 好 的 搜索 策略 ， 以 下 讨论 的 鲍 
威 尔 方法 就 属 这 种 情况 。 





给 定 X 中 Ee 
出 < 一 X(0) 









SO e; 
I 
XXX roads 
1 LE i i 
cx: minf (XH to ds) 
Pay 


图 4-12 ”坐标 轮换 法 的 程序 框图 


| 多 


a) b) c) 


图 4-13 ”搜索 过 程 的 几 种 情况 
a) 搜索 有 效 b) 搜索 低 效 ec) 搜索 无 效 
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4.8 ”鲍威尔 方法 





鲍威尔 方法 是 直接 利用 也 数值 来 构造 共 固 方 各 的 一 种 共 轿 方 呵 法 。 这 种 方法 是 
在 人 研究 具有 正定 矩阵 G 的 二 次 函数 
l XGOX +D 和 +c 


A\X) = 


的 极 小 化 问题 时 形成 的 。 其 基本 思想 是 在 不 用 导数 的 前 提 下 ， 在 迭代 中 逐次 构造 G 
的 共 力 方 回 。 


4.8.1 基本 原理 
设 叶 2 、X 7 为 从 不 同 点 出 发 ， 沿 同一 方向 S7 进行 一 维 搜索 而 得 到 的 两 个 极 














小 点 ， 如 图 4-14 所 示 。 根 据 梯度 和 等 值 面相 垂直 的 性 质 ，SW 科 ”、X“* 两 点 
处 的 梯度 VX")、VA(X™*，) 之 间 存 在 关系 : 
(8 WX YS0 
EA 
另 一 方面 ， 对 于 上 述 二 次 函数 ， 其 XY”、X“* 两 点 处 的 梯度 可 表示 为 
V(X”)=GX"+b 





V/C™®) 


图 4-14 通过 一 维 搜索 确定 共 恩 方 癌 


WA 二 人 系 (+1) +Db 





两 式 相 减 ， 得 
V(X ) V(X™® ) Ee (OD _ 和 (有 ) 
因而 有 
(SO WE) 0)) 08) 7G (XY -XV) =0 (4-25) 
若 取 方向 8 = 0 -于 ， 如 图 4-14 所 示 ， 则 SY 和 SY 对 G 共 罗 。 这 说 明 
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只 要 沿 S” 方向 分 别 对 函数 做 两 次 一 维 搜索 ， 得 到 两 个 极 小 点 站 ”和 下 "” ， 那 么 这 
两 点 的 连 线 所 给 出 的 方向 就 是 与 $S” 一 起 对 G 共 斩 的 方向 。 

对 于 二 维 问题 ， 态 蕊 ) 的 等 值 线 为 一 族 李 圆 ， 4、B 为 沿 xi 轴 方向 上 的 两 个 极 小 
点 ， 分 别处 于 等 值 线 与 x, 轴 方向 的 切 点 上 ， 如 图 4-15 所 示 。 根 据 上 述 分 析 ， 则 4、 
B 两 点 的 连 线 就 是 与 轴 x 一 起 对 G 共 红 的 方向 。 沿 此 共 思 方 向 进行 一 维 搜 索 就 可 找 


到 峭 数 亿 芷 ) 的 极 小 点 : 对”。 





2 


图 4-15 二 维 情 况 下 的 共 力 方向 
4. 8.2 迭 代 过 程 及 算法 框图 


1. 鲍威尔 方法 的 基本 算法 
现在 针对 二 维 情 况 来 描述 鲍威尔 的 基本 算法 ， 如 图 4-16 所 示 。 


X2 





XO xO 





图 4-16 二 维 情况 下 的 鲍威尔 方法 
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1) 任 选 一 初始 点 X'”， 再 选 两 个 线性 无 关 的 向 量 ， 如 坐标 轴 单 位 向 量 e, = (1， 
0) 和 e, = (0,1) 作为 初始 搜索 方向 。 

2) 从 XW 出发， 顺 次 沿 e, 、e; 做 一 维 搜索 得 点 ”、X”， 两 点 连 线 得 一 新 
方 回 

S00 = 0 

用 SW 代替 e, 形 成 两 个 线性 无 关 的 向 量 e, 、$S ， 作 为 下 一 轮 迄 代 的 搜索 方向 。 
再 从 名 ”出 发 ， 沿 SW 做 一 维 搜索 得 ”， 并 将 其 作为 下 一 轮 迭 代 的 初始 点 。 

3) 从 Xo 出发， 顺 次 沿 e, 、SW 做 一 维 搜索 得 点 XI ”、X; ”， 两 点 连 线 得 一 新 
方 回 

SO) = 

Xo0 、X” 两 点 是 从 不 同 点 ”、X 出 发 ,分别 沿 5S 方向 进行 一 维 搜索 而 得 
的 极 小 点 ， 因 此 XX” 、ZXZ "两 点 连 线 的 方向 5S 同 SW 一 起 对 G 共 轧 。 再 从 XY 出 
发 ， 沿 SW 做 一 维 搜索 得 点 。 

因为 X 相当 于 从 XW 出 发 分 别 沿 G 的 两 个 共 斩 方 向 9 、$ ”进行 两 次 一 维 搜 
索 而 得 到 的 点 ， 所 以 X” 点 即 是 二 维 问题 的 极 小 点 和 ”。 

把 二 维 情 况 的 基本 算法 扩展 到 n 维 ， 则 鲍威尔 基本 算法 的 要 点 是 : 在 每 一 轮 
达 代 中 总 有 一 个 始点 (第 一 轮 的 始点 是 任 选 的 初始 点 ) 和 有 履 个 线性 独立 的 搜索 
方向 。 从 始点 出 发 顺 次 沿 n 个 方 回 做 一 维 搜索 得 一 终点 ， 由 始点 和 终点 决定 了 一 
个 新 的 搜索 方 回 。 用 这 个 方向 瞧 换 原来 n 个 方向 中 的 一 个 ， 于 是 形成 新 的 搜索 方 
向 组 。 替 换 的 原则 是 去 掉 原 方向 组 的 第 一 个 方向 而 将 新 方向 排 在 原 方向 的 最 后 。 
此 外 规定 ， 从 这 一 轮 的 搜索 终点 出 发 沿 新 的 搜索 方向 做 一 维 搜索 而 得 到 的 极 小 
上 态 ， 作 为 下 一 轮 选 代 的 始点 。 这 样 就 形成 算法 的 循环 。 因 为 这 种 方法 在 迭代 中 未 
次 生成 共 斩 方 向 ， 而 共 箔 方向 是 较 好 的 搜索 方向 ， 所 以 鲍威尔 方法 又 称 作 方 间 加 
速 法 。 

上 述 基本 算法 仅 具 有 理论 音义， 不 要 说 对 于 一 般 冰 数 ， 就 是 对 于 二 次 函数 ， 这 
个 算法 也 可 能 失效 ， 因 为 在 迭代 中 的 款 个 搜索 方 各 有 时 会 变 成 线性 相关 而 不 能 形成 
共 轿 方向 。 这 时 张 不 成 n 维 空间 ， 可 能 求 不 到 极 小 点 ， 所 以 上 述 基本 算法 有 答 
改进 。 

2. 改进 的 鲍威尔 算法 

在 鲍威尔 基本 算法 中 ， 每 一 轮 和 闪 代 都 用 连接 始点 和 终点 所 产生 出 的 搜索 方 回去 
蔡 换 原 回 量 组 中 的 第 一 个 回 量 ， 而 不 管 它 的 “好 坏 ”， 这 是 产生 辐 量 组 线性 相关 的 
原因 所 在 。 因 此 在 改进 的 算法 中 首先 判断 原 回 量 组 是 否 需要 蔡 换 。 如 果 需 要 符 换 ， 
还 要 进一步 判断 原 向 量 组 中 哪个 向 量 最 坏 ， 然 后 再 用 新 产生 的 向 量 瞧 换 这 个 最 坏 的 
问 量 ， 以 保证 逐次 生成 共 斩 方 癌 。 

改进 算法 的 具体 步骤 如 下 : 
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1) 给 定 初始 点 ”( 记 作 X”)。 选 取 初 始 方 向 组 ， 它 由 个 线性 无 关 的 向 量 
SW SW 、…、SW (如 nn 个 坐标 轴 单 位 向 量 e, 、e，,、…、e,) 所 组 成 ， 置 和 -0。 
2) 从 XX 出 发 ， 顺 次 沿 S452 、S 和 9 、…、S09 做 一 维 搜索 得 到 2 、 忆 2” 、… 
0 。 接 着 以 和 为 起 点 ， 沿 方向 
Si = 
移动 一 个 X， -区 ”的 距离 ， 得 到 
下 =, 二 (天 一 天 ) =2X -Ro 
和 、 于 0、 互信 分 别称 为 一 轮 适 代 的 始点 、 终 点 和 反射 点 。 始 点 、 终 点 和 反 
射 点 所 对 应 的 函数 值 分 别 表示 为 
Fo = 成 成 ) 
7 SA 
F; 二 所 是 
同时 计算 各 中 间 点 处 的 函数 值 ， 并 记 为 
大寿 人 0 


因此 有 Fo =fo, PF, =, 
ni sh th 

记 作 Ai =fi-1 -fi(i=1,2,.…,n) 

其 中 最 大 者 记 作 A, = max A; =f, 1 -fo 


l<i<n 


3) 根据 是 否 满 足 判 别 条 件 F， < 让 或 (下 三 和 2 F, eu (Fn Ss -人 ) US 
(局 -下 ) "来 确定 是 否 要 对 原 方向 组 进行 奉 换 。 

若 不 满足 判别 条 件 ， 则 下 轮 迭 代 仍 用 原 方向 组 ， 并 以 XI? 、X 人 中 函数 值 小 者 
作为 下 轮 迄 代 的 始点 。 

若 满足 上 述 判 别 条 件 ， 则 下 轮 迁 代 应 对 原 方向 组 进行 替换 ， 将 84 补充 到 原 方 
向 组 的 最 后 位 置 ， 而 除 掉 $S% 。 即 新 方向 组 为 8 、8 和 、:、 SS 、 
S0 、$4 作 为 下 轮 迭 代 的 搜索 方向 。 下 轮 迭 代 的 始点 取 为 沿 84 方 向 进行 一 维 搜 
索 的 极 小 点 XD。 

4) 判断 是 否 满足 收敛 准则 。 若 满足 则 取 各 ?为 极 小 点 ， 否 则 应 置 hk +1 
返回 2) ， 继 续 进 行 下 一 轮 迭 代 。 

这 样 重复 迭代 的 结果 ， 后 面 加 进去 的 向 量 都 彼此 对 G 共 力 ， 经 n 轮 扩 代 即 可 
得 到 一 个 由 】 个 共 力 方向 所 组 成 的 方向 组 。 对 于 二 次 函数 ， 最 多 不 超过 次 就 可 找 
到 极 小 点 ， 而 对 一 般 函 数 ， 往 往 要 超过 次 才能 找到 极 小 点 (这 里 的 “n” 表 示 设 
计 空 间 的 维 数 ) 。 

改进 后 的 鲍威尔 方法 程序 框图 如 图 4-17 所 示 。 

鲍威尔 方法 是 鲍威尔 于 1964 年 提出 的 ， 以 后 又 经 过 他 本 人 的 改进 。 该 方法 是 
一 种 有 效 的 共 斩 方向 法 ， 它 可 以 在 有 限 步 内 找到 二 次 函数 的 极 小 点 。 对 于 非 二 次 函 
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只 要 具有 连续 二 阶 导数 ， 用 这 种 方法 也 是 有 效 的 。 


XO XO), Se, 









XH ro SO 
fm tos 
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(K+1) (月 
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夺 ] 


Re XD 





X A 六 中 


图 4-17 改进 后 的 鲍威尔 方法 的 程序 框图 
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4.9 单 形 替换 法 


4.9.1 基本 原理 


函数 的 导数 是 困 数 性 态 的 反映 ， 它 对 选择 搜索 方向 提供 了 有 用 的 信息 。 例 如 ， 
最 速 下 降 法 、 共 斩 梯 度 法 、 变 尺度 法 和 和 牛顿 法 等 ， 都 是 利用 函数 一 阶 或 二 阶 导 数 信 
息 来 建立 搜索 方向 的 。 在 不 计算 导数 的 情况 下 ， 先 算出 才干 点 处 的 函数 值 ， 从 它们 
之 间 的 大 小 关系 中 也 可 以 看 出 也 数 变化 的 大 概 趋 热 ， 为 寻求 函数 的 下 降 方 回 提供 依 
据 。 这 里 所 说 的 硅 干 点 ， 一般 取 在 单纯 形 的 项 点 上 。 所 谓 单纯 形 是 指 在 n 维 空 间 中 
具有 n+1l 个 顶点 的 多 面体 。 利 用 单纯 形 的 顶点 ， 计 算 其 函数 值 并 加 以 比较 ， 从 中 
确定 有 利 的 搜索 方 品 和 步 长 ， 找 到 一 个 较 好 的 点 取代 单纯 形 中 较 差 的 点 ， 组 成 新 的 
单纯 形 来 代 蔡 原来 的 单纯 形 。 使 新 单纯 形 不 断 地 癌 目标 函数 的 极 小 点 靠近 ， 直 到 搜 
索 到 极 小 点 为 止 。 这 就 是 单 形 奉 换 法 的 基本 思想 。 在 线性 规划 中 ， 我 们 将 提 到 单纯 
形 法 ， 那 是 因为 线性 规划 问题 是 在 凸 多 面体 顶点 集 上 进行 迭代 求解 。 这 里 是 无 约束 
极 小 化 中 的 单 形 替换 法 ， 利 用 不 断 蔡 换 单 纯 形 来 寻找 无 约束 极 小 点 。 虽 然 二 者 都 用 
到 单纯 形 ， 但 决 不 可 以 把 这 两 种 方法 混淆 起 来 。 为 此 我 们 将 通常 在 无 约束 极 小 化 中 
所 说 的 单纯 形 法 ， 称 作 单 形 奉 换 法 ， 以 避免 和 线性 规划 中 的 单纯 形 法 相 混 消 。 

现 以 二 元 函数 1x >) 为 例 ， 说 明 单 形 蔡 换 法 的 基本 原理 。 

如 图 4-18 所 示 ， 在 x10 x 平面 上 取 不 在 同一 直线 上 的 三 点 和 、 忆 、 天 ， 以 它 
们 为 项 点 组 成 一 单纯 形 ( 即 三 角形 )。 计 算 各 顶点 函数 值 ， 设 























图 4-18 单 形 蔡 换 法 


A(X1) > 成 于 ) >f(X,) 
这 说 明和 ;点 最 好 ， 成 点 最 差 。 为 了 寻找 极 小 点 ， 一 般 来 说 ， 应 回 最 差点 的 反 
对 称 方向 进行 搜索 。 即 通过 忆 并 穿 过 对 怀 的 中 氮 导 的 方向 进行 搜索 。 在 此 方向 上 
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取 点 ;使 
Xs =X, +(X,—X) =2 XX 

5 点 称 作 筷 点 相对 于 局 点 的 反射 点 ， 计 算 反 射 点 的 图 数值 所 EX ) ， 可 能 出 现 以 

(1) AR) < 所 2 ) 即 反 射 点 比 最 好 点 还 好 ， 说 明 搜 索 方 各 正 确 ， 还 可 以 往 
前 进一步 也 就 是 可 以 扩张 。 这 时 取 扩 张 点 

Xs = +Q(X4 一 下 ) 

式 中 ，a 为 扩张 因子 , 一般 取 a=1.2 ~2.0。 

如 果 扎 Xe ) <fX;)， 说 明 扩 张 有 利 ， 就 以 X 代 蔡 X 构成 新 单纯 形 X,X; 和 6。 否 
则 说 明 扩 张 不 利 ， 人 舍弃 秆 。， 仍 以 X; 代 蔡 对 , ， 构 成 新 单纯 形 X, 半 ,和 。 

(2) AX;) AX;) < A(X,)” 即 反映 点 比 最 好 点 差 , 但 比 次 差点 好 ， 说 明 反 
射 可 行 ， 则 以 反射 点 代 蔡 最 差点 ， 仍 构成 新 单纯 形 X XXX 。 

(3) 所 和 ) 近 扩 5 ) <fA(X1)” 即 反射 点 比 次 差点 差 .， 但 比 最 差点 好 ,说 明和 站; 走 
得 太 远 ， 应 缩 回 一 些 ， 即 收缩 。 这 时 取 收 缩 点 

XX =X +B(X; = 

式 中 ,BB 为 收缩 因子 ， 常 取 成 B=0.5。 

如 果 所 和 7 ) < 站) ， 则 用 耻 代 蔡 了 ,构成 新 单纯 形 和 站 ,和 外; ， 否 则 ;不 用 。 

(4) A(X;) 三 A Xi) 即 反 射 点 比 最 差点 还 差 ， 这 时 应 收缩 得 更 多 一 些 ， 即 将 
新 点 收缩 在 入 于 :之 间 ， 取 收缩 操 

Xs = —B(K, —X)) = +B(X) 一 天 4 ) 

如 果 玫 站,) < ) ， 则 用 处 代 蔡 处 ,构成 新 单纯 形 半 ,和 外 ， 否 则 站 不 用 。 

(5) A/( 半 ) >f( 站 )” 即 硅 共 息 方 问 x 
上 的 所 有 点 都 比 最 差点 差 ， 则 说 明 不 能 
沿 此 方 回 搜索 。 这 时 应 以 总 为 中 心 缩 
边 ， 使 项 点 和 、 殉 回 筷 移 近 一 半 距 离 ， 
得 新 单纯 形 和 ;站 "站; ， 如 图 4-19 所 示 ， 
在 此 基础 上 进行 寻 优 。 x 

以 上 说 明 ， 可 以 通过 反映 、 扩 张 、 
收缩 和 缩 边 等 方式 得 到 一 个 新 单纯 形 ， 
其 中 至 少 有 一 个 顶点 的 函数 值 比 原单 纯 
形 要 小 。 


4.9.2 迁 代 过 程 及 算法 框图 


将 上 述 对 二 元 函数 的 处 置 方法 扩展 应 用 到 多 元 函数 作 半 ) 中 ， 其 计算 步 怠 如 下 : 
1) 构造 初始 单纯 形 。 选 初始 点 。，， 从 出 发 沿 各 华 标 轴 方 向 走 步 长 h, 得 n 
个 顶点 和 (i=1,2,…,n) 与 和 构成 初始 单纯 形 。 这 样 可 以 保证 此 单纯 形 各 边 是 n 个 
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线性 无 关 的 向 量 ， 和 否则 就 会 使 搜索 范围 局 限 在 某 个 较 低 维 的 空间 内 ， 有 可 能 找 不 到 
极 小 点 。 
2) 计算 各 顶点 函数 值 
FA LEQ L200) 
3) 比较 函数 值 的 大 小 ， 确 定 最 好 点 X,、 最 差点 XY 和 次 差点 X。。 即 有 
J =X smi (i012 0) 
二 全 
fisf(Xo y= my (i=0,12, hl ln) 
4) 检验 是 否 满足 收敛 准则 





<eé 





fu -fi 
六 





如 满足 ， 则 X ”= 于 ， 结 束 ， 否 则 转 5) 。 
5) 计算 除 邓 点 之 外 各 点 的 “重心 ”, ,1: 


| (4-26) 


反射 点 : 
X12 三 之 入 1 一生 H 
fat2 =f (X12) (427) 
当 太 生态， < 时， 以 和 人 代 蔡 和 Er ， 太 2 代 蔡 记 ， 构 成 一 新 单纯 形 ， 然 后 返回 到 
3) 。 
6) 扩张 ， 当 fi,， < 时 ， 取 扩张 点 
X, ,3 = + oa (KR, — kh, ) (4-28) 
并 计算 其 函数 值 f, ,= 了 (X, ,3) 。 耕 fi 13 < 有 2， 则 以 XY,, 代 巷 和 4 ，f ,3 代 准 fr， 形成 
一 新 单纯 形 ; 否则 ， 以 和 , 代替 En, 万 代 答 广 ， 形 成 新 单纯 形 ， 然 后 返回 到 3 ) 。 
7) 收缩 : 当 f,s 宇 ft 时 则 需 收 缩 。 如 果 f,， < 让 ， 则 取 收 缩 扣 
X14 = —B(X,,, ky, 
并 计算 其 函数 值 f, ,4 =f(X,,); 否则 ， 在 上 式 中 以 Xi 代替 X,,,， 计 算 收 缩 点 竺 , ,4 及 
其 函数 值 f, ,4。 如 果 f, ,4 < 万 ， 则 以 下 人 代 管 和 ， 太 当代 蔡 广 ， 得 新 单纯 形 ， 返 回 到 
3) ， 人 否则 转 8) 。 
8) 缩 边 : 将 单纯 形 缩 边 ， 可 将 各 向 量 
XX (i=0,1,2,.…,n) 


? ? ? 


的 长 度 都 缩小 一 半 ， 即 
Ki =X -3X KL) = Kt) (i=0,1,2,.,n) 


并 返回 到 2)。 
单 形 符 换 法 的 程序 框图 如 图 4-20 所 示 。 
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给 出 初始 单纯 形 各 顶点 Xi(i=0， 1 > us ,11) 





ff XN 1, 2 1) 






/i /XD), 万 一 Cn， fa (Xo) 


Xnt2™ 2Xnt2 — XH 
ye LS f/f(Xnt2) 


扩张 


AH43< Xnrit Xnt2 Xnt1) 否 
fg fC) Eee 


收缩 


Xnt4— Xnrith Xn? Xnt1) 
Zi f/f(Xntd) 


边 1 
Xi (Xi XL) 


(二 0， 1 Dp ah) 


图 4-20 单 形 替换 法 的 程序 框图 
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4.10 无 约束 优化 设计 实例 


例 4-1 用 最 速 下 降 法 求 目 标 函 数 拓 和 ) =x? +25 2 的 极 小 点 。 
解 : 取 初 始点 0 
则 初始 点 处 函数 值 及 梯度 分 别 为 
f(X'™) =104 


2 0 -| . 
ww 


50 x 100 
治 负 梯 度 方 向 进行 一 维 搜索 ， 有 
万 5) 二 万 (0) _ 成 多 VA(X'") 


Be 
2 100) \2-100@'™" 
其 中 ，a" 为 一 维 搜索 最 佳 步 长 ， 应 满足 极 值 必要 条 件 ， 则 有 
放下 ) =minKX -a VX )) 
= min| (2-4@a'™ 0 100a'40， )*] = mino( at ) 
p'(a' )= -8(2-4aw5) -5000(2 -100 ww) ) =0 
从 而 算出 一 维 搜索 最 佳 步 长 


(0) 6020 
= 31757 = 0. 02003072 


以 及 第 一 次 迭代 设计 点 位 置 和 因数 值 
0 -| pn, We | -| 1. 919877 
2 0 -0. 3071785 x10™ 
7 ) =3.686164 
从 而 完成 了 最 速 下 降 法 的 第 一 次 迭代 。 继 续 做 下 去 ， 经 10 次 迭代 后 ， 得 到 最 优 解 
KX* =(0,0)" 
AX )=0 
例 4-2 试用 原始 牛顿 法 求 目标 函数 A/) =60 -10 x -42 +x1 +%2 一 Xi%, 的 极 
小 点 ， 初 始点 ”= (0,0)'。 
解 : 了 ”= (0,0) ， "处 的 函数 梯度 、 黑 塞 矩 阵 分 别 为 
V(X) - (4D HD 区 3 -| 4 











Ox! Ox, J x 2 x,—X1—4 —4 





0) ofCX)Y 





0 XX OXIOX 法 ”二 并 
琳 ( 瑟 0 ) = Vo(X")= 1 2 -| 
of(X) of(X) -1 2 
0 X30 XI1 > X2 /yo) 
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2 1 
(XW ) 的 伴随 算 阵 为 | 浊 其 行列 式 | 及 (对 中 ) 1 =3， 故 五 (X'0 ) 的 着 矩阵 





[H(X'M)] = i 1 | ,| 


由 式 (4-7) 求 下 一 个 迭代 点 人 ”， 得 
万 5D) 二 万 0) [rH(CX™ ) ] 1 V(X ) 


0 1/2 1 一 10 
ll | | 
0\ 1/-24, /8 
| | 2 ie 
和 ”=|[8,6] "和 目标 函数 理论 极 小 点 对 ”= [8,6] 一 致 ， 亦 即 本 例 只 迭代 一 次 
即 达 目标 函数 极 小 点 。 
由 例 4-2 可 以 看 出 ， 当 目标 函数 A 和) 是 二 次 函数 时 ， 由 于 二 次 泰勒 展开 也 数 
2p( 马 ) 与 原 目 标 函 数 大 筷 ) 不 是 近似 而 是 完全 相同 的 二 次 式 ， 黑 塞 和 矩阵 且 (X" ) 是 一 
个 常数 矩阵 ， 由 式 (4-7) 知 从 任 一 初始 点 出 发 ， 只 需 一 步 迭 代 即 达 f(X) 的 极 小 
点 ， 因 此 和 牛顿 法 也 是 一 种 具有 二 次 收敛 性 的 算法 。 对 于 非 二 次 函数 ， 夺 函数 的 二 次 
性 态 较 强 ,或 迭代 点 已 进入 极 小 点 的 邻 域 ， 则 其 收敛 速度 也 是 很 快 的 ， 这 是 牛顿 法 
的 主要 优点 。 但 原始 牛顿 法 由 于 迭代 公式 中 没有 步 长 因子 ， 而 是 定 步 长 迭代 ， 对 于 
非 二 次 型 目标 函数 ， 有 时 会 使 函数 值 上 升 ， 即 出 现 AX ) > 大 和 ) 的 情况 ， 这 
表明 原始 牛顿 法 不 能 保证 函数 值 稳定 地 下 降 ， 在 严重 的 情况 下 甚至 可 能 造成 迭代 点 
列 的 发 散 而 导致 计算 失败 。 
例 4-3 目标 函数 为 F(X) =4(x +1) +2(x, -1) +x +x +10， 设 初始 点 
X'" =(0,0) ,梯度 精度 a =0. 01 ， 试 用 阻尼 牛顿 法 求 目标 函数 极 小 点 和 极 小 值 。 
解 : X 0 =(0,0) ,于 "点 处 的 函数 梯度 、 黑 塞 和 矩阵 分 别 为 


V(X ) 三 CS 0 三 pn se -| 3 





























of(X) PAX)N 








Ox OXIO% 8 0 

H(XO) = VerEoO) -| ， -| 
9f(X) Jf(X) 0 4 
O X30 XI 0 XJ) 


4 0 


H(X®) 的 伴随 矩阵 为 | 


应 为 


其 行列 式 | 五 (XX ) 1 =32， 瓦 (0 ) 的 送 矩 阵 
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一 0 
(0)\、]1-1 ] A 
[H(X ) | ye | 0 1 
4 
牛顿 方向 
Vg 
pk nl WY)=- 
Ss | YN ps) 3 
4 


从 于 中 A 沿 8@) 方 向 一 维 搜索 求 最 优 步 长 因 em | 
着 天 十 WO Ss) ) = min( 厌 (9) 十 w(0 Sg) ) 


d 宇 0) + (0) S (0) 2 区 、 、 
SL =0, 求 得 a =1， 于 是 得 下 一 个 迭代 点 





到 0) OR 网 


天 |» lo 


和 点 的 梯度 为 
8 Xi +9 0 
(1)、 
VA(X )= (4. | | 
检验 迁 代 终止 条 件 


| VCXo)|=0<s 
和 欠 代 结束 ， 得 极 小 点 


2 s 
下 | , f{(X* ) =9. 8125 


2 -1l 0 
| 

的 一 组 共 斩 向 量 系 8 、S 7 、S 。 
解 : 选 三 个 坐标 轴 上 的 单位 问 量 eo、 CE1、 e;, 作 为 一 组 线性 无 关 问 量 系 : 


1 0 0 
eo = 中 = 四 e, = | 
0 0 1 
1 
取 Sb 四 
0 


例 4-4 求 
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设 
SS) = e， +B'" S00) 
2 -1 OWY0 
(1,0,0)| -1 2 -1|1 
CO (S$)'Ge, 0 -1 2 人 0/)/ 
1 (SINGSY 2 | 0 1 = 
(1,0,0)| -1 2 -11l0 
0 -1 2 八 0 
得 
oj A 全 
SC) 1 Py 0 |= 
2 1 
0 0 0 
设 
SS?) =@, +BS SS' +B SS'" 
1) ($V)'Ge, 
2 -GS 
和 2 
! 1 
0 
2 -1l UV7O 
(1,0,0)| -1 2 1 10 
CE 0 -1 2 人 1I) 
(SIGS0 2 -El OY1Y 
(1,0,0)| -1 2 1 0 
0 -1 2 人 0 
得 
0 六 3 
So2) =|0 2 =| 2 
311 ee 
| 3 
9 1 
计算 表明 (so)'G so IE 
=0(iz¥7) 


说 明 S'”、S' ”、S* 对 GG 共 思 g。 
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例 4-5 用 共 斩 梯 度 法 求 二 次 函数 
f(KR) =x? +2 x7 一 4X -2 xx, 


的 极 小 点 及 极 小 值 。 
解 : 取 初 始点 
Xa 
则 
2x1 —2x, 一 人 -4 
VA(X'M) = = 
A | 国 | | 
取 


4 
SO - VY -| 
J i 

沿 SW 方 向 进行 一 维 搜索 ， 得 


YO RO FY G0 - | | ,| -| 


1 +4@'" 
1 2 


2 


其 中 ，a9 为 最 佳 步 长 ， 可 通过 7KXD) = min pi, (ao )，o(a' ) =0 求 得 


则 


为 建立 第 二 个 共 斩 方 向 S0) ， 需 计算 于 2) 点 处 的 梯度 VAF(XED ) 及 系数 B00) 
值 ， 得 


| 





4x, 一 2Xi 一 2 
oo WAXES _1 
1VE DT 20 4 


从 而 求 得 第 二 个 共 斩 方 向 
本 
/1 CD 民 | , -| 
中 人 
再 沿 S' 进行 一 维 搜索 ， 得 


27 2 A 
2) 一 万 () et = 1 度 二 1 3 (1) 
7 十 Q 


其 中 ，a™ 为 最 佳 步 长 ， 通 过 
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AX ) =ming, (a ) ,加 (ao) =0 


求 得 a' "=1 
2 +2 at) 4 
则 “=|1 3 0)|= 
二 2 
2 2 


计算 X ”点 处 的 梯度 
2X1 —2%x, 一 4 0 

Vy (2) 二 二 

AX ) | 4X， 一 2%i 加 . a 
说 明 XX” 点 满足 极 值 必要 条 件 ， 再 根据 和 ”点 的 黑 塞 和 矩阵 

和 2。 “二 2 

2 | 
是 正定 的 ， 可 知 忆 ”点 满足 极 值 充 分 必要 条 件 。 故 站 点 为 极 小 点 ， 即 


LE | 
2 


BC -| 


而 函数 极 小 值 为 f/(X )= -8 
从 共 恩 梯度 法 的 计算 过 程 可 以 看 出 ， 第 一 个 搜索 方向 取 作 人 负 梯 度 方 喇 ， 这 就 是 
最 速 下 降 法 。 其 余 各 步 的 搜索 方向 是 将 负 梯 度 偏转 一 个 角度 ， 也 就 是 对 负 梯 度 进行 
修正 。 所 以 共 轿 标 度 法 实质 上 是 对 最 速 下 降 法 进行 的 一 种 改进 ， 故 它 又 被 称 作 旋 转 
梯度 法 。 
例 4-6 用 DFP 算法 求 
f(K) =x? +2 x7 —4 x —2 xi%, 











的 极 值 解 。 
解 : 1) 取 初 始点 ”= (1,1) ,为 了 按 DFP 算法 构造 第 一 次 搜寻 方向 9” ， 
需 计算 初始 点 处 的 梯度 


2X1 一 2X， 一 人 -4 
VCX™ Ss -| 
A ) | 4x, 一 2Xi 网 之 


并 取 初 始 变 尺 度 矩 阵 为 单位 矩阵 M … =7， 则 第 一 次 搜寻 方向 为 
ee 
0 1 必 =2 

沿 S” 方 向 进行 一 维 搜索 ， 得 


(0) 
YD SRO 0 G0) - | ra | | 1+4aw 
] 二 这 1 -2a" 








其 中 a 为 一 维 搜索 最 佳 步 长 ， 应 满足 
f(xX'Y) = minf(¥'" +a VS ) =min(40 a -200' -3) 
得 a'" =0. 25 
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we 1+4 | . 2 
人 =(0 5 


2) 再 按 DFP 算法 构造 ”点 处 的 搜寻 方向 5'"”， 需 计算 


VX ) 2x1 —2x, 一 人 ey 
1 -| 4x2 一 2X1 本 


= VD- WO =| -| . | | 


(00) = _ 友 (9) -| 
一 0. 9 
代入 校正 公式 (4-22) 
祁 六 a (z°) MOyV yy MD 
(Zo Ty (yo My 











| ET 1 | 


,05){ 3) -9 人 3 


4 
21 19 

1/ 9 -12, |25 50 

3 = 上 可 = 19 41 
50 100 





则 第 二 次 搜寻 方 回 为 


2 19 3 

Sy Vx) ee 25 $0 | 本 _ S 

lI9 41 |\ -2/ |6 

50 100 5 

再 沿 S'” 进行 一 维 搜索 ， 得 
8 2 Fe (1) 
dC A - 本 了 上 

全 0 0) 

5 0.5+ so 


其 中 a 为 一 维 搜索 最 佳 步 长 ， 应 满足 


有 = minF( 飞人 Pa 9 ) =min( so" = - 冯 ) 


一 
红 
RQ 


一 0. 9 


_ 
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3) 为 了 判断 对 ”点 是 否 为 极 值 点 ， 需 计算 x” 点 处 的 梯度 及 其 黑 塞 矩 阵 


Xi —2x, —4 0 
VX)=| -| 
A ) ll 4x, —2%x i 0 


a 
人 )=| ， 四 
梯度 为 零 向 量 ， 黑 塞 矩 阵 正 定 。 可 见 X ”点 满足 极 值 充 要 条 件 ， 因 此 和 点 为 


极 小 点 。 此 搬 数 的 极 值 解 为 








ED 0 
f/f(X ) = 一 
例 4-7 用 鲍威尔 方法 求 函 数 f(xi,%,) i + Xs 一 5 上 + (Xi — x, )” 的 极 
小 值 。 
解 : 选取 初始 点 ”= (0,0) ， 初 始 搜索 方向 S" =e = (1,0) ，S$) =e, = 
(0,1) ,初始 点 处 的 函数 值 F, =f =f( I” ) =250。 
第 一 轮 迄 代 : 
1) 沿 Si 方向 进行 一 维 搜索 ,和 
0 1) (0 0 1 1 a 
0 eo 
fi=f(X")=10 (a -5) to 











最 佳 步 长 a'" 可 通过 gf 到 ee 
OQ 
得 
a = =4 5455 
4. 5455 
人 
0 


从 而 算出 ”点 处 的 函数 值 及 沿 SW 走 步 后 函数 值 的 增 量 
F=f =f(X™") =22.727 
= 7 
2) 再 沿 S; 方向 进 0 
YO) 2X0 FS - 4 | a 轩 六 | 
0 ] Q 

f=f(X") =10 (4.5455 +at2) -5)* +(4.5455 -at )? 

最 佳 步 长 a 的 计算 可 根据 
0 


de 





=20(@'” -0.4545) -2(4.5455 ~- a2) ) =0 





得 
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| 
人 


人 


=0. 8264 


” 0.8264 
从 而 算出 第 一 轮 终点 下 "处 的 函数 值 及 沿 S!9 走 步 后 的 函数 值 增 量 
F,=f, =f(X") =15.214 
A = = 727 =15. 214=7.513 
取 沿 Si” 、Ss” 走 步 后 函数 值 增 量 中 的 最 大 者 
A, = A, =227. 273 
终点 ”的 反射 点 及 其 函数 值 分 别 为 
4.5455\ /0 9. 091 
| | 
R24 
3) 为 确定 下 一 轮 迭 代 的 搜索 方 品 和 起 始点 ， 需 检查 判别 条 件 f < 或 (Ff -2 
f+F) (PF,-F, -A,) <0.5 A,(Ff, -了 ,)’ 是 否 满足 。 
因为 f; > Ff。， 所 以 不 满足 判别 条 件 ， 因 而 下 一 轮 迭 代 应 继续 使 用 原来 的 搜索 
Ba A 
因为 <F;， 所 以 取 xs 为 下 一 轮 迭 代 的 起 始点 。 
第 二 轮 迭 代 : 
第 二 轮 初 始点 及 其 函数 值 分 别 为 


区 = 三 | 




















Bp =2| 


4. 5455 
| 
Fo = 万 =F(E) ) =15.214 

1) 沿 e 方 向 〈 即 zx 轴 方 向 ) 进行 一 维 搜索 ， 相 当 于 固定 x, =0. 8264， 即 改变 
x 使 函数 (xi ,x ) 的 值 极 小 。 设 计 点 Xi 的 位 置 可 通过 函数 对 x 的 偏 导数 等 于 零 求 
得 ， 即 
xs)=10(x +0.8264 -5 ) +(x -0.8264 )” 
和 =20(x -4 1736) +2(x -0.8264) =0 


85. 1248 


mi = =3.8693 


得 





Xi 点 处 的 函数 值 及 函数 值 增 量 分 别 为 
F=f =f(X'") =10.185 
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A, =f -fi =15.214 -10. 185 =5. 029 
2) 再 沿 e, 方 同 ( 即 x, 轴 方 则 ) 进行 一 维 搜索 ， 相 当 于 固定 x, =3. 8693 ， 即 改 
变 x, 使 函数 A(xi ,x%, ) 的 值 极 小 。 设 计 点 XY” 的 位 置 可 通过 函数 对 x, 的 偏 导数 等 于 零 
求 得 ， 即 
xs) =10(3.8693 +x, -5 ) +(3.8693 -2 ) 


起 -20(w -1.1307) +2(3. 8693 _%,) =0 


0 X» 
30. 3526 
MX? 二 ID 二 1. 3797 
3. 8093 
日 (1) 
号 2 二 | 





第 二 轮 终点 如 ”处 的 函数 值 及 沿 x, 方 向 函数 值 增 量 分 别 为 
F,=f =f(X'Y) =6. 818 
A, =f, -f, =10. 185 -6.818 =3. 367 
取 沿 x1 、%, 方 同 走 步 后 ， 艺 数值 增 量 最 大 者 为 
A, =A, =5. 029 
终点 到 “的 反射 点 及 其 函数 值 分 别 为 
3. 网 | 司 30 

















1. 3797) \0.8264) \1.9330 
7 
3) 为 确定 下 一 轮 迭 代 的 搜索 方 喇 和 起 始点 ， 需 检查 判别 条 件 f < fi 或 (Ff -2 
+ ) (Fo -Ff-A,) <0.5A,(F -也 ) 。 经 代入 运算 知 该 判别 条 件 满足 ， 应 进 
行 方向 替换 用 新 方向 $;， 替换 e, ， 下 一 轮 迭 代 搜 索 方向 为 e; 、S3"。 
3. [ | | 一 0. 册 


天 二 2 和 人 三 天 全 =2| 


1.3797)/ 【0. 8264 0. 5533 
下 一 轮 氨 代 起 始点 ”为 从 台 出 发 ， 沿 $3 方向 进行 一 维 搜索 的 极 小 点 ， 可 
通过 下 面 计算 求 得 。 


SY 三 党 a _ | 


3. 8693，， af -0.6762) _ /3. 8693 -0. 6762 a 
1. | 下 | 0. | 3797 +0. 5533 | 
f(X”) =10(3. 8693 -0. 6762 a +1.3797 +0.5533 a -5 )? 

+ (3. 8693 -0. 6762 a -1.3797 -0.5533 a )? 


0 -| 





df 
da = 
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(3) 2489.6 
=2. 0257 
因此 ， 下 一 轮 迭 代 初 始点 及 其 也 数值 分 别 为 
六 攻 
? 2. 5005 


F=f =f(xs™ ) =0.000001 
可 见 已 足够 接近 极 值 点 ”= (2.5,2.5) 及 极 小 值 f(X*) =0。 
例 4-8 试用 单 形 蔡 换 法 求 
A 0 +(%,—6 ) 
的 极 小 值 。 
解 : 选取 X& = (8,9) ,XX = (10,11) ,X= (8,11) 为 顶点 作 初 始 单纯 形 ， 如 
图 4-21 所 示 。 计 算 各 顶点 函数 值 : 
fo =f(X,) =45 ， fi =f(X,) =125,， f» =f(X,) =01] 
可 见 最 好 点 和 =X， 最 差点 Xi = 站 ， 次 差点 Xe = 轧 。 





图 4-21 单 形 替换 法 的 迭代 过 程 


求 XX,、 Kg XX, 的 重心 站 : 
1 /8 
各 = (加入 -| = 7X + Xk) = | 


10 
求 反射 点 中 及 其 函数 值 /: 
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ee 


fa =f(X) =13 
由 于 万 i 故 需 扩张 ， 取 a =2 得 扩张 点 X,: 


A = 四 | 


fs =f(¥;) =8 

由 于 f; < 有 ， 故 以 对 ;代替 于, ， 由 关 , 针 ,下 ;构成 新 单纯 形 ， 进 行 下 一 循环 。 经 32 
次 循环 ， 可 将 目标 函数 值 降 到 1 x10“， 接 近 极 小 值 f* =f(X*) =f (5,6) =0。 
单 形 蔡 换 法 当 问 题 维 数 n 较 高 时 ， 需 要 经 过 很 多 次 迭代 ， 因 此 一 般 用 于 n<10 

的 情况 。 
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5.1 概述 





机 械 优 化 设计 中 的 问题 ， 大 多 数 属 于 约束 优化 设计 问题 ， 其 数学 模型 为 
minf (XX) =f( x ,Xs Yo ) 
SE BR 0 ly (5-1) 
hy(X) = h(x ry) =0(E=1,2,%,h) 

求解 式 (5-1) 的 方法 称 为 约束 优化 方法 。 根 据 求解 方式 的 不 同 ， 可 分 为 直接 
解法 、 间 接 解法 等 。 

直接 解法 通常 适用 于 仅 含 不 等 式 约 束 的 问题 ， 它 的 基本 思路 是 在 m 个 不 等 式 
约束 条 件 所 确定 的 可 行 域内 ， 选 择 一 个 初始 点 XW”， 然 后 决定 可 行 搜 索 方向 S$， 且 
以 适当 的 步 长 gq 沿 5 方 同 进行 搜索 ， 得 到 一 个 使 目标 孔 数 值 下 降 的 可 行 的 新 点 
革 '“”， 即 完成 一 次 迭代 。 再 以 新 点 为 起 点 ,重复 上 述 搜 索 过 程 ， 满 足 收 敛 条 件 后 ， 
迭代 终止 。 每 次 授 代 计算 均 按 以 下 基本 送 代 格 式 进行 : 

Rs (sl (2 
式 中 ，a™ 为 步 长 ; S ”为 可 行 搜索 方向 。 

所 谓 可 行 搜索 方 回 是 指 ， 当 设计 点 沿 该 方 同 做 微量 移动 时 ,目标 函数 值 将 下 
降 ， 且 不 会 越 出 可 行 域 。 产 生 可 行 搜索 方向 的 方法 将 由 直接 解法 中 的 各 种 算法 
决定 。 

和 直接 解法 的 原理 简单 ， 方 法 实用 。 其 特点 是 : 

1) 由 于 整个 求解 过 程 在 可 行 域内 进行 ， 因此， 迭代 计算 不 论 何 时 终止 ,都 可 
以 获得 一 个 比 初始 点 好 的 设计 点 。 

2) 奉 目 标 函 数 为 凸 范 数 ， 可 行 域 为 凸 集 ， 则 可 保证 获得 全 域 最 优 解 。 否 则 . 
因 存 在 多 个 局 部 最 优 解 ， 当 选择 的 初始 点 不 相同 时 ， 可 能 搜索 到 不 同 的 局 部 最 优 
解 。 为 此 ， 稼 在 可 行 域内 选择 几 个 差别 较 大 的 初始 点 分 别 进行 计算 ， 以 便 从 求 得 的 
多 个 局 部 最 优 解 中 选择 更 好 的 最 优 解 。 

3) 要 求 可 行 域 为 有 界 的 非 空 集 ， 即 在 有 界 可 行 域内 存在 满足 全 部 约束 条 件 的 
点 ， 且 目标 冰 数 有 定义 。 

间接 解法 有 不 同 的 求解 策略 ， 其 中 一 种 解法 的 基本 思路 是 将 约束 优化 问题 中 的 
约束 也 数 进行 特殊 的 加 权 处 理 后 与 目标 函数 结合 起 来 ， 构 成 一 个 新 的 目标 函数 ， 即 
将 原 约束 优化 问题 转化 成 为 一 个 或 一 系列 的 无 约束 优化 问题 。 再 对 新 的 目标 函数 进 
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行 无 约束 优化 计算 ， 从 而 可 间接 地 搜索 到 原 约束 问题 的 最 优 解 。 
间接 解法 的 基本 迭代 过 程 是 ， 首 先 将 式 (5-1) 所 示 的 约束 优化 问题 转化 成 新 
的 无 约束 目标 隐 数 


PO sp) = AR) + Pic XK) + DHLh(X)] (53) 





式 中 ，$(X,p1 ve ) 为 转换 后 的 新 目标 函数 ; 了 pC[a(X)] 、 了 poH[h(X)] 分 


别 为 约束 函数 g, (和) 、h,(X) 经 过 加 权 处 理 后 构成 的 某 种 形式 的 复合 函数 或 泛 函 数 ; 
Ai 、 几 为 加 权 因 子 。 

然后 对 $(XX,pi ya ) 进行 无 约束 极 小 化 计算 。 由 于 在 新 目标 函数 中 包含 了 各 种 
约束 条 件 ， 在 求 极 值 的 过 程 中 还 将 改变 加 权 因子 的 大 小 。 因 此 可 以 不 断 地 调整 设计 
点 ， 使 其 逐步 逼近 约束 边界 ， 从 而 间接 地 求 得 原 约束 问题 的 最 优 解 。 图 5-1 所 示 的 
框图 表示 了 这 一 基本 迭代 过 程 。 

















输入 n， ,0 M1, H2 
构造 9 (X， Hi, /2) 


求 minbg(CX, ALD) 


改变 属 ， Ww 的 值 


满足 收敛 条 件 ? 


图 5-1 间接 解法 框图 


5.2 随机 方向 法 


5.2.1 基本 原理 


随机 方向 法 是 一 种 原理 简单 的 下 接 解 法 。 它 的 基本 思路 ( 见 图 52) 是 在 可 行 
域内 选择 一 个 初始 点 ， 利 用 随机 数 的 概 座 特性， 产生 奋 干 个 随机 方 咖 ， 并 从 中 选择 
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一 个 能 使 目标 函数 值 下 降 最 快 的 随机 方向 作为 可 行 搜索 方向 ， 记 作 S$。 从 初始 点 
导出 发 ， 沿 $ 方 向 以 一 定 的 步 长 进行 搜索 ， 得 到 新 点 于， 新 点 蕊 应 满足 约束 条 
件 : g&(XE) 生 00 =1,2,…,m)， 且 f() </(X'”) 至 此 完成 一 次 迭代 。 然 后 ， 将 起 
始点 移 至 际 ， 即 令 X' ”了 。 重 复 以 上 过 程 ， 经 过 若干 次 奖 代 计 算 后 ， 最 终 取 得 约 
束 最 优 解 。 

















图 5-2 随机 方向 法 的 算法 原理 





随机 方向 法 的 优点 是 对 目标 函数 的 性 态 无 特殊 要 求 ， 程 序 设计 简单 ， 使 用 方 
便 。 由 于 可 行 搜 索 方 回 是 从 许多 随机 方向 中 选择 的 使 目标 函数 值 下 降 最 快 的 方向 ， 
此 外 步 长 还 可 以 灵活 变动 ,所 以 此 算法 的 收敛 速度 比较 快 。 大 能 取得 一 个 较 好 的 初 
始点 ， 和 迭代 次 数 可 以 大 大 减少 。 随 机 方向 法 是 求解 小 型 的 机 械 优 化 设计 问题 的 一 种 
十 分 有 效 的 算法 。 


5.2.2 随机 数 的 产生 


在 随机 方向 法 中 ， 为 产生 可 行 的 初始 点 及 随机 方向 ， 需 要 用 到 大 量 的 
(0, 1) 和 (=-1，1) 区 间 内 均匀 分 布 的 随机 数 。 在 计算 机 内 ， 随 机 数 通 党 
是 按 一 定 的 数学 模型 进行 计算 后 得 到 的 。 这 样 得 到 的 随机 数 称 为 伪 随 机 数 ， 
它 的 特点 是 产生 速度 快 ， 计 算 机 内 存 占 用 少 ， 并 且 有 较 好 的 概率 统计 特性 。 
产生 伪 随 机 数 的 方法 有 很 多 ,下面 仅 介 绍 一 种 常用 的 产生 伪 随 机 数 的 数学 
模型 。 

首先 令 m =2”, r, = 2 ，m =2”, 有 取 r=2657863 (7r 为 小 于 m 的 正 奇数 ) ， 然 后 
按 以 下 步 又 计算 


令 re 9r 
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咎 7 三 方 ， 则 re 一方; 
硅 r 宇 np ， 则 rer -ns; 
和 在 rr 三 mn ， 则 re 一 六 
则 q =r/r 
q 即 为 (0, 1) 区 间 内 的 伪 随 机 数 。 利 用 9 容易 求 得 任意 区 间 (a, 5) 内 的 伪 随 机 
数 ， 其 计算 公式 为 








x=at+g(b -a) 
$5.2.3 初始 点 的 选择 


随机 方向 法 的 初始 点 了 ”必须 是 一 个 可 行 点 ， 即 满足 全 部 不 等 式 约束 条 件 : 
gi( 半 ) 二 0G =1,2,…,m) 的 点 。 当 约束 条 件 较为 复杂 ， 用 人 工 不 易 选 择 可 行 初始 点 
时 ， 可 用 随机 选择 的 方法 来 产生 。 其 计算 步 又 如 下 : 

1) 输入 设计 变量 的 下 限 值 和 上 限 值 ， 即 

a,<x,<b, (i=1,2,.…,n) 
2) 在 区 间 (0，1) 内 产生 nn 个 伪 随 机 数 g;(i=1,2,…,n)。 
3) 计算 随机 点 子 的 各 分 量 
x,=a,+g(b,—a) (i=1,2,.…,n) 

4) 判别 随机 点 芋 是 否 可 行 。 若 随机 点 半 为 可 行 点 ， 则 取 初 始点 XW” 一 著 ; 若 

随机 点 蕊 为 非 可 行 点 ， 则 转 步 又 2) 重新 计算 ， 直 到 产生 的 随机 点 是 可 行 点 为 止 。 


5.2.4 可 行 搜索 方向 的 产生 


在 随机 方向 法 中 ， 产 生 可 行 搜索 方向 的 方法 是 从 (hk 三 n) 个 随机 方向 中 ， 选 取 
一 个 较 好 的 方向 。 

其 计算 步骤 为 : 

1) 在 (-1，1) 区 间 内 产生 伪 随 机 数 r (i=1,2,…,n;j =1,2,…,k)， 按 下 
式 计 算 随 机 单位 向 量 : 




















i 1 £4 ; 
C 一 i 1 (J 一 Ls eh) (5-4) 
[Dt | 
i=1 FY 
2) 取 一 试验 步 长 a，”， 按 下 式 计算 个 随机 点 : 
X =X" ta er? (j=1,2,.…,k) (5-5) 





显然 ,有 个 随机 点 分 布 在 以 初始 点 对” 为 中 心 ， 以 试验 步 长 a 为 半径 的 超 球 
面 上 。 
3) 检验 个 随机 点 对 (j=1,2,…,) 是否 为 可 行 点 ， 除 去 非 可 行 点 ， 计 算 余 
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下 的 可 行 随机 点 的 目标 函数 值 ， 比 较 其 大 小 ， 选 出 目标 函数 值 最 小 的 点 X。 
4) 比较 X, 和 XW” 两 点 的 目标 函数 值 ， 若 f(X) <f(XW”)， 则 取 X 和 X'” 的 连 
线 方向 作为 可 行 搜索 方向 ; 若 f(X) 二 /( 半 ”) ， 则 将 步 长 ”缩小 ， 转 步骤 1) 重 
新 计算 ， 直 至 fCX,) <fLXW ) 为 止 。 如 果 aw' 缩 小 到 很 小 (例如 ，a'o 大 10 5) ， 仍 
然 找 不 到 一 个 X,， 使 让) </(X”)， 则 说 明了 对 是 一 个 局 部 极 小 点 ， 此 时 可 更 换 
初始 点 ， 转 步骤 1) 。 
综 上 所 述 ， 产 生 可 行 搜索 方向 的 条 件 可 概括 为 ， 当 ,点 满足 
gj;( XL) <0(]=1,2,.…,m) 
wun ae (5-6) 
(XL.) </(X"™) 











则 可 行 搜索 方向 为 
S = 妃 一 不 (0) (Sy 
5) 搜索 步 长 的 确定 。 可 行 搜索 方向 $ 确定 后 ， 初 始点 移 至 Xi 点 ， 即 XW 
， 从 对 点 出 发 沿 5 方 向 进行 搜索 ， 所 用 的 步 长 a 一般 按 加 速 步 长 法 来 确定 。 所 
谓 加 速 步 长 法 是 指 依次 迭代 的 步 长 按 一 定 的 比例 递增 的 方法 。 各 次 迭代 的 步 长 按 下 
式 计算 : 
Q =7Q (5-8) 
式 中 ,7 为 步 长 加 速 系数 ， 可 取 7=1.3; a 为 步 长 ， 初 始 步 长 取 w = w' 9 。 


5.2.5 迭 代 过 程 及 算法 框图 


随机 方 癌 法 的 计算 步 又 如 下 : 

1) 选择 一 个 可 行 的 初始 点 XX”。 

2) 按 式 (5-4) 产生 个 nn 维 随机 单位 向 量 e” (j=1,2,…,k)。 

3) 取 试 验 步 长 ea”， 按 式 (5-5) 计算 出 个 随机 点 (j=1,2,…,k)。 

4) 在 天 个 随机 点 中 ， 找 出 满足 式 〈5-6) 的 随机 反 X.; 产生 可 行 搜索 方向 S = 
Es 

5) 从 初始 点 站 ”出 发 ， 沿 可 行 搜索 方向 $ 以 步 长 XY” 进行 迭代 计算 ,直至 搜 
索 到 一 个 满足 全 部 约束 条 件 ， 且 目标 冰 数 值 不 再 下 降 的 新 点 天。 

6) 奋 收敛 条 件 








AX) -A XY) < 
(5.9) 


IX -Xs<e, 
得 到 满足 ， 和 迭代 终止 。 约 束 最 优 解 为 X”= 半 ，f(X*) =f( 了 对) 。 否 则 , 令 X“” 半 转 
步骤 2) 。 
随机 方向 法 的 程序 框图 如 图 5-3 所 示 。 
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输入 n、 XO QO, E€、k 


证 


否 
机 选择 XX 


fi, Nf) 








图 5-3 ”随机 方向 法 的 程序 框图 
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5.3 复合 形 ; 


S.3.1 基本 原理 


复合 形 法 是 求解 约束 优化 问题 的 一 种 重要 的 直接 解法 。 它 的 基本 思路 〈 见 
图 5-4) 是 在 可 行 域内 构造 一 个 具有 个 顶点 的 初始 复合 形 。 对 该 复合 形 各 顶点 的 
目标 也 数 值 进行 比较 ， 找 到 目标 函数 值 最 大 的 项 点 ( 称 最 坏 点 )， 然 后 按 一 定 的 法 
则 求 出 目标 函数 值 有 所 下 降 的 可 行 的 新 点 ， 并 用 此 点 代替 最 坏 点 ,构成 新 的 复合 
形 ， 复合 形 的 形状 每 改变 一 次 ， 就 向 最 优点 移动 一 步 ， 直 至 台 近 最 优点。 


























图 5-4 复合 形 法 的 算法 原理 


由 于 复合 形 的 形状 不 必 保持 规则 的 图 形 ， 对 目标 函数 及 约束 函数 的 性 状 又 无 特 
殊 要 求 ， 因 此 适应 性 较 强 ， 在 机 械 优化 设计 中 得 到 广泛 应 用 。 


5.3.2 初始 复合 形 的 产生 


1. 初始 复合 形 的 形成 
复合 形 法 是 在 可 行 域内 直接 搜索 最 优点 ， 因 此 ， 要 求 初始 复合 形 在 可 行 域内 生 
成 ， 即 初始 复合 形 的 个 顶点 必须 都 是 可 行 点 。 
生成 初始 复合 形 的 方法 有 以 下 儿 种 : 
1) 由 设计 者 决定 正 个 可 行 点 ， 构 成 初始 复合 形 。 当 设计 变量 较 多 或 约束 男 数 
复杂 时 ， 由 设计 者 决定 个 可 行 点 常常 很 困难 。 只 有 在 设计 变量 少 ,约束 函数 简单 
的 情况 下 ， 这 种 方法 才 被 采用 。 
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2) 由 设计 者 选 定 一 个 可 行 点 ， 其 余 的 《k -1) 个 可 行 点 用 随机 法 产生 。 各 顶 

点 按 下 式 计算 : 
X=atr(b-a) (j=1,2,.…,k) (5-10) 

式 中 ,天 为 复合 形 中 的 第 j 个 顶点 ; a、5 分 别 为 设计 变量 的 下 限 和 上 限 ; 为 在 
(0, 1) 区 间 内 的 伪 随 机 数 。 

用 式 (5-10) 计算 得 到 的 (上 -1) 个 随机 点 不 一 定 都 在 可 行 域内 ， 因 此 要 设 
法 将 非 可 行 点 移 到 可 行 域内 。 通 常 采 用 的 方法 是 ， 求 出 已 经 在 可 行 域内 的 工 个 顶点 
的 中 心 Xv: 

















天 二 EE” (5-11) 
然后 将 非 可 行 点 加 中 心 点 移动 ， 即 
Xi,1 = +0.5(X,,1 -Xe) (5-12) 
奉天 1 仍 为 不 可 行 点 ， 则 利用 式 (5-12)， 使 其 继续 向 中 心 各 移动。 显然， 只 
要 中 心 点 可 行 ， 名 ,点 一 定 可 以 移 到 可 行 域 内 。 随 机 产生 的 (k-1) 个 点 经 过 这 


样 的 处 理 后 ， 全 部 成 为 可 行 点 ， 并 构成 初始 复合 形 。 

事实 上 ， 只 要 可 行 域 为 是 集 ， 其 中 心 点 必 为 可 行 态 ， 用 上 述 方法 可 以 成 功 地 在 
可 行 域内 构成 初始 复合 形 。 如 果 可 行 域 为 非 凸 集 ， 如 图 5-5 所 示 ， 中 心 点 不 一 定 在 
可 行 域 之 内 ， 则 上 述 方法 可 能 失败 。 此 时 可 以 通过 改变 设计 变量 的 下 限 和 上 限 值 ， 
重新 产生 各 顶点 。 经 过 多 次 试 算 ， 有 可 能 在 可 行 域内 生成 初始 复合 形 。 


XH 


0 


图 5-5 中 心 点 半 c 为 非 可 行 点 的 情况 














3) 由 计算 机 目 动 生成 初始 复合 形 的 全 部 项 点 。 其 方法 是 首先 随机 产生 一 个 可 
行 点 ， 然 后 按 第 二 种 方法 产生 其 余 的 (上 -1) 个 可 行 点 。 这 种 方法 对 设计 者 来 说 
最 为 简单 ， 但 因 初 始 复 合 形 在 可 行 域内 的 位 置 不 能 控制 ， 可 能 会 给 以 后 的 计算 市 来 
困难 。 

2. 复合 形 法 的 搜索 方法 

在 可 行 域内 生成 初始 复合 形 后 ， 将 采用 不 同 的 搜索 方法 来 改变 其 形状 ， 使 复合 
形 逐 步 向 约束 最 优点 趋 近 。 改 变 复 合 形 形 状 的 搜索 方法 主要 有 以 下 几 种 : 

(1) 反射 ”反射 是 改变 复合 形 形 状 的 一 种 主要 策略 ， 其 计算 步 又 为 : 

















88 | 机 械 优化 设计 与 实例 





1) 计算 复合 形 各 项 点 的 目标 函数 值 ， 并 比较 其 大 小 ， 求 出 最 好 点 XX 、 最 坏 点 
及 次 坏 点 X。， 即 





XL :A( XL) =min|f(X,) lp 
Xn :f( X11) =max|f/(X,) [hd 
XC :/(X.) =min|f(X¥,) ee 
2) 计算 除去 最 坏 点 &a 外 的 《KE-1) 个 项 点 的 中 心 。: 


1 
Xe = 过 总 (5-13 ) 








3) 从 统计 的 观点 来 看 ， 一 般 情 况 下 ， 最 坏 点 &r 和 中 心 点 导 的 连 线 方向 为 目标 
胃 数 下 降 的 方向 。 为 此 ， 以 叶 点 为 中 心 ， 将 最 坏 点 &a 按 一 定 比例 进行 反射 ， 有 和 布 
望 找到 一 个 比 最 坏 点 EX 的 目标 画 数值 为 小 的 新 点 &，XR 称 为 反射 点 。 其 计算 公 
式 为 











XX =X +a(X -XX) (5-14) 
式 中 ，a 为 反射 系数 ， 一 般 取 a=1.3。 

反射 点 与 最 坏 点 4、 中 心 点 .的 相对 位 置 如 图 5-6 所 示 。 

4) 判别 反射 点 ;的 位 置 ， 若 ;为 可 行 点 ， 则 比较 , 和 XX 两 点 的 目标 函数 值 ， 
如 果 f( Xn) <f(Xa)， 则 用 XX 取代 Xs， 构 成 新 的 复合 形 ， 完 成 一 次 迭代 ;如果 
/Xi ) 二 /Xs) ， 则 将 a 缩小 为 原来 的 7/10， 用 式 (5-14) 重新 计算 新 的 反射 点 ， 
若 仍 不 可 行 ， 继 续 缩小 ， 直 至 /Xi) </(X,) 为 止 。 

若 忆 为 非 可 行 点 ， 则 将 “ 缩小 为 原来 的 7/10， 仍 用 式 (5-14) 计算 反射 点 X;， 
直至 为 可 行 点 为 止 。 然 后 重复 以 上 步骤 ， 即 判别 了 (XX) 和 2) 的 大 小 ， 一 旦 
用 ) <f(X4) ， 用 也 取代 和 完成 一 次 迁 代 。 

综 上 所 述 ， 反 射 成 功 的 条 件 是 

(和 ) <0( =1,2,.,m) 
| 











(5-15 ) 


XD 
CS 
路 x 


XCc 


XH 


图 5-6 XX 、XH 与 &c 的 相对 位 置 
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(2) 扩张 ” 当 求 得 的 反射 点 和 为 可 行 点 ， 且 目标 函数 值 下 降 较 多 (如 
所 入) <7 几 Re))， 则 沿 反射 方向 继续 移动 ， 即 采用 扩张 的 方法 ， 可 能 找到 更 好 的 新 
态 全 sb， 站 p 称 为 扩张 点 。 其 计算 公式 为 
Xt = Xr +y( XR 一 下 c) 
式 中 ，y 为 扩张 系数 ， 一般 取 y =1。 
扩张 点 和 与 中 心 点 叶 、 反 射 点 和 的 相对 位 置 如 图 5-7 所 示 。 











AH 


图 5-7 ”和 与 中 心 点 E、 反 射 点 和 的 相对 位 置 


在 扩张 点 和 为 可 行 点 ， 且 所 和 ) < 所 XX) ， 则 称 扩 张 成 功 ， 用 和 取代 KR， 构成 
新 的 复合 形 。 和 否则 称 扩 张 失 败 ， 放 径 扩 张 ， 仍 用 原 反 射 点 和 取代 Xr， 构 成 新 的 复 
合 形 。 

(3) 收缩 ” 春 在 中 心 点 夺 以 外 找 不 到 好 的 反射 点 ， 还 可 以 在 Xec 以 内 ， 即 采用 
收缩 的 方法 寻找 较 好 的 新 点 和 ， 筷 称 为 收缩 点 。 其 计算 公式 为 

A =X +B(X. — XH) (5-16) 
式 中 ，B 为 收缩 系数 ,一 般 取 B=0.7 。 
收缩 点 下 .与 最 坏 点 和 y 及 中 心 点 竺 .的 相对 位 置 如 图 5-8 所 示 。 


p(Xc-Xn) 














XC 


AH 


图 5-8 闷 与 最 坏 点 2 及 中 心 点 于 < 的 相对 位 置 


在 所 和) < 故 E6) ， 则 称 收缩 成 功 ， 用 和 取代 Xr ， 构 成 新 的 复合 形 。 
(4) 压缩 ” 厂 采 用 上 述 各 种 方法 均 无 效 ， 还 可 以 采取 将 复合 形 各 顶点 向 最 好 
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点 下 靠拢 ， 即 采用 压缩 的 方法 来 改变 复合 形 的 形状 。 压 缩 后 的 各 顶点 的 计算 公 
式 为 





=, -0.5(K, -LK) =1,2,.,k;j LL) (5-17) 
压缩 后 的 复合 形 各 顶点 的 相对 位 置 如 图 5-9 所 示 。 


XG 








压缩 后 的 新 复合 形 





图 5-9 复合 形 的 压缩 变形 


然后 ， 再 对 压缩 后 的 复合 形 采用 反射 、 扩 张 或 收缩 等 方法 ， 继 续 改 变 复 合 形 的 
形状 。 

除 此 之 外 ， 还 可 以 采用 旋转 等 方法 来 改变 复合 形 形 状 。 应 当 指 出 的 是 ， 采 用 改 
变 复合 形 形 状 的 方法 越 多 ， 程 序 设计 越 复 杂 ， 有 可 能 降低 计算 效率 及 可 徘 性 。 因 
此 ， 程 序 设计 时 ， 应 针对 具体 情况 ， 采 用 某 些 有 效 的 方法 。 


S.3.3 ” 适 代 过 程 及 算法 框图 


基本 的 复合 形 法 〈 只 会 反射 ) 的 计算 步骤 为 : 

1) 选择 复合 形 的 顶点 数 k， 一 般 取 n+1<h<2n， 在 可 行 域内 构成 具有 儿 个 项 
所 的 初始 复合 形 。 

2) 计算 复合 形 各 顶点 的 坐标 函数 值 ， 比 较 其 大 小 ， 找 出 最 好 点 了.、 最 坏 点 站 
及 次 坏 点 时 c。 

3) 计算 除去 最 坏 点 &a 以 外 的 (下 -1) 个 项 点 的 中 心 点 Eee。 判 别 轩 是 否 可 行 ， 
右 导 为 可 行 点 ， 则 转 步 又 4) ; 在 导 为 非 可 行 点 ， 则 重新 确定 设计 变量 的 下 限 和 上 
限 值 ， 即 令 




















a =X,,b =X. (5-18) 
然后 转 步 又 1) ， 重 新 构造 初始 复合 形 。 
4) 按 式 (5-14) 计算 反射 点 加 ， 必 要 时 ， 改 变 反 射 系数 a 的 值 ， 即 满足 式 
(5-15 )。 然 后 以 取代 XX， 构成 新 的 复合 形 。 
5) 耕 收 敛 条 件 





by [A\X) -AD <e (5-19) 
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得 到 满足 ， 计 算 终止 ,约束 最 优 解 为 X”=X.， fA 作 半 ” ) = 凡生 ) ， 否 则 ， 转 步骤 2) 。 
复合 形 法 的 程序 框图 如 图 5-10 所 示 。 


形成 初始 复合 形 的 k 个 顶点 
Xi 六 1， 2 人 月 








计算 各 顶点 的 目标 函数 值 
fAXN(FF1,， 2 k) 


将 各 项 点 的 目标 函数 值 和 坐标 
按 目标 函数 值 的 大 小 排序 


计算 除去 XH 后 的 各 顶点 中 心 : 


k 
1 
Xc= 一 > C0, jzH 
lj 


求 反 射 点 XR 一 Xcto(Xc-XH) 








以 次 坏 点 XG 代替 最 坏 点 XH 





是 


图 5-10 复合 形 法 的 程序 框图 
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5.4 可行 方 向 法 


5.4.1 基本 原理 


约束 优化 问题 的 直接 解法 中 ， 可 行 方 器 法 是 最 大 的 一 类 ， 它 也 是 求解 大 型 约束 
优化 问题 的 主要 方法 之 一 。 这 种 方法 的 基本 原理 是 在 可 行 域 内 选择 一 个 初始 点 
对 ， 当 确定 了 一 个 可 行 方向 S$ 和 适当 的 步 长 后 ， 按 下 式 

XD) XY roas®? (k=1,2,.…) (5-20) 
进行 欠 代 计算 。 在 不 断 调整 可 行 方向 的 过 程 中 ， 使 和 迭代 点 逐步 逼近 约束 最 优点 。 

1 可行 方 向 法 的 搜索 策略 

可 行 方 向 法 的 第 一 步 迭 代 都 是 从 可 行 的 初始 点 出 发 ， 沿 ”点 的 负 梯 度 方 
向 SW = - VAX )， 将 初始 点 移动 到 某 一 个 约束 面 (只 有 一 个 起 作用 的 约束 时 ) 
上 或 约束 面 的 交集 (有 几 个 起 作用 的 约束 时 ) 上 。 然 后 根据 约束 水 数 和 目标 函数 
的 不 同性 状 分 别 采 用 以 下 几 种 策略 继续 搜索 。 

第 一 种 情况 如 图 5-11 所 示 ， 在 约束 面 上 的 迭代 点 ”处 ， 产 生 一 个 可 行 方 向 
S$” ， 沿 此 方向 做 一 维 最 优化 搜索 ， 所 得 到 的 新 点 站 在 可 行 域内 ， 即 令 筷 ”= 瑟 ， 
再 沿 对 “点 的 负 梯 度 方向 SY = - W(X" ) 继 续 搜 索 。 

第 二 种 情况 如 图 5-12 所 示 ， 沿 可 行 方向 S$” 做 一 维 最 优化 搜索 ， 所 得 到 的 新 
点 天 在 可 行 域外 ， 则 设法 将 于 点 移动 到 约束 面 上 ， 即 取 $ 和 约束 面 的 交点 作为 
新 的 迭代 点 于  。 























图 5-11 新 点 在 可 行 域内 的 情况 图 5-12 ”新 点 在 可 行 域外 的 情况 





第 三 种 情况 是 治 约束 面 搜索 。 对 于 只 具有 线性 约束 条 件 的 非 线 性 规划 问题 
( 见 图 5-13)， 从 半点 出 发 ， 沿 约束 面 移动 ， 在 有 限 的 几 步 内 即 可 搜索 到 约束 最 
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优点 ; 对 于 非 线性 约束 函数 〈 见 图 5-14) ， 党 约束 面 移动 将 会 进入 非 可 行 域 ， 使 问 
题 变 得 复杂 得 多 。 此 时 ， 需 将 进入 非 可 行 域 的 新 点 下 设法 调整 到 约束 面 上 ， 然 后 
才能 进行 下 一 次 迭代 。 调 整 的 方法 是 先 规定 约束 面容 差 6， 建立 新 的 约束 边界 (如 
图 5-14 上 的 虚线 所 示 ) ， 然 后 将 已 离开 约束 面 的 半点， 沿 起 作用 约束 吨 数 的 负 梯 度 
方向 - Vg(XE) 返 回 到 约束 面 上 。 其 计算 公式 为 











下 = 下 +Q， Vg( 玉 ) 2 
式 中 ，%w, 称 为 调整 步 长 ， 可 用 试探 法 决定 ， 或 用 下 式 估算 : 
下 g(X¥) 
“7 | vex) 1 Vel¥) 0 
CC-0 gs1(X)=0 
0) 





图 5-13 ”沿线 性 约束 面 的 搜索 图 5-14 沿线 性 约束 面 的 搜索 


2. 产生 可 行 方向 的 条 件 
可 行 方向 是 指 沿 该 方向 做 微小 移动 后 所 得 到 的 新 点 是 可 行 点 ， 且 目标 函数 值 有 
所 下 降 。 显 然 ， 可 行 方向 应 满足 可 行 和 下 降 两 个 条 件 。 
(1) 可 行 条 件 方向 的 可 行 条 件 是 指 沿 该 方向 做 微小 移动 后 ， 所 得 到 的 新 点 
为 可 行 点 。 如 图 5-15a 所 示 ， 若 对 点 在 一 个 约束 面 上 ， 过 关 ” 点 作 约 束 面 (处 ) = 
0 的 切线 7+， 显 然 满足 可 行 条 件 的 方向 $S ”应 与 起 作用 的 约束 函数 在 瑟 ”点 的 梯度 
Ve(X"") 的 夹 角 大 于 或 等 于 90*。 用 向 量 关 系 式 可 表示 为 
国人 (5-23) 
若 半 ”点 在 J 个 约束 面 的 交集 上 ， 如 图 5-15 b 所 示 ， 为 保证 方向 S$ 可行 ， 要 求 
SW 和 J 个 约束 函数 在 ”点 的 梯度 Ve,(X”) (j=1,2…,/) 的 夹 角 均 大 于 或 等 于 
90°。 其 向 量 关系 可 表示 为 
[ Yetx™ TS 0 (el DD (5-24) 
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a) 


图 5-15 方向 的 可 行 条 件 
a) 一 个 起 作用 的 约束 ”b) 两 个 起 作用 的 约束 





(2) 下 降 条 件 ”方向 的 下 降 条 件 是 
指 沿 该 方向 做 微小 移动 后 ， 所 得 新 点 的 
目标 孔 数 值 是 下 降 的 。 如 图 5-16 所 示 ， 
满足 下 降 条 件 的 方向 $S ”应 和 目标 函数 在 
和 ”点 的 梯度 V(X ) 的 夹 角 大 于 90°。 
其 回 量 关 系 可 表示 为 
| 
满足 可 行 和 下 降 条 件 ， 即 式 (5-24) 
和 式 (5-25 ) 同时 成 立 的 方 回 称 为 可 行 
方向 。 如 图 5-17 所 示 ， 它 位 于 约束 曲面 
在 对 ”点 的 切线 和 目标 函数 等 值 线 在 
了 点 的 切线 所 围 成 的 扇形 区 内 ， 该 肩 形 
区 称 为 可 行 下 降 方向 区 。 














VCKCO) 






g1&X)0 


V/CW) 


图 5-16 方向 的 下 降 条 件 


图 5-17 ”可行 下 降 方向 区 
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综 上 所 述 ， 当 半点 位 于 J 个 起 作用 的 约束 面 上 时 ， 满 足 
:Ve ee 
[er 

的 方向 S 称 为 可 行 方向 。 

3. 可 行 方向 的 产生 方法 

如 上 所 述 ， 满 足 可 行 、 下 降 条 件 的 方向 位 于 可 行 下 降 扇形 区 内 ， 在 扇形 区 内 导 
找 一 个 最 有 利 的 方向 作为 本 次 迭代 的 搜索 方向 ， 其 方法 主要 有 优选 方向 法 和 梯度 投 
影 法 两 种 。 

(1) 优选 方向 法 ”在 由 式 〈5-26) 构成 的 可 行 下 降 扇形 区 内 选择 任 一 方向 $ 
进行 搜索 ， 可 得 到 一 个 目标 函数 值 下 降 的 可 行 点 。 现 在 的 问题 是 如 何在 可 行 下 降 遍 
形 区 内 选择 一 个 能 使 目标 函数 下 降 最 快 的 方向 作为 本 次 选 代 的 方向 。 显 然 ， 这 是 一 
个 以 搜索 方向 5 为 设计 变量 的 约束 优化 问题 ， 这 个 新 的 约束 优化 问题 的 数学 模型 
可 写成 


(5-26 ) 





























s.t.min| VE )]7S 
[We 二 0， G1,2%,)) 
[ VX'®™)]'S<O0 
Is|sI 
由 于 VX ) 和 Ve;(XX”)]" <0(j=1,2,…,J) 为 定 值 ， 上 述 各 函数 均 为 设 
计 变 量 的 线性 函数 ， 因 此 式 (5-27) 为 一 个 线性 规划 问题 。 用 线性 规划 法 求解 
后 ， 求 得 的 最 优 解 $ 即 为 本 次 迭代 的 可 行 方向 ， 即 $ ”=S ”。 


($5-27) 





(2) 梯度 投影 法 当 圣 ” 点 目标 g,(X)-0 
函数 的 负 梯 度 方向 - V/A(X" ) 不 满 \ 
足 可 行 条 件 时 ， 可 将 - V/A(X") 方 -VvV/(X®) 
问 投 影 到 约束 面 (或 约束 面 的 交集 ) ~ 


上 ， 得 到 投影 向 量 S$” ， 从 图 5-18 中 
可 看 出 ， 该 投影 加 量 显然 满足 方 回 的 
可 行 和 下 降 条 件 。 梯 度 投 影 法 就 是 取 
该 方向 作为 本 次 达 代 的 可 行 方向 。 可 














行 方向 的 计算 公式 为 
SO = -P VX NP WX) 
($5-28) 
式 中 ，V/(X”) 为 目标 函数 在 竺 ”处 图 5-18 ”约束 面 上 的 梯度 投影 方向 


的 梯度 ; P 为 投影 算 子 ,为 n xn 阶 
矩阵， 其 计算 公式 为 
P=I-G(GG) GG (5-29) 
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式 中 ,7 为 n xn 阶 单位 矩阵 ; G 为 起 作用 约束 函数 的 nxJ 阶梯 度 和 矩阵 ， 且 
Ge Wo 5 Veg, (X™ ) Ve,(X'")) 


式 中 ,J 为 起 作用 的 约束 也 数 个 数 。 
4. 步 长 的 确定 


可 行 方向 S ”确定 后 ， 按 下 式 计算 新 的 迭代 点 : 
ED SRO 下 WODSO (5-30) 
由 于 目标 函数 及 约束 函数 的 性 状 不 同 ， 步 长 a” 的 确定 方法 也 不 同 ， 不 论 是 用 
何 种 方法 ， 都 应 使 新 的 迭代 点 下“ ”为 可 行 点 ， 且 目标 函数 具有 最 大 的 下 降 量 。 确 





定 步 长 w ”的 常用 方法 有 以 下 两 种 : 

(1) 取 最 优 步 长 ”如 图 5-19 所 
示 ， 从 半点 出 发 ， 沿 $” 方向 进行 
一 维 最 优化 搜索 ， 取 得 最 优 步 长 a”， 
计算 新 点 于 的 值 : 

X=X" ta Ss 

若 新 点 下 为 可 行 点 ， 则 本 次 迭代 
的 步 长 取 a =a”。 

(2) w' >” 取 到 约束 边界 的 最 大 
步 长 ”如 图 5-20 所 示 ， 从 关中 点 沿 
$9 方 向 进行 一 维 最 优化 搜索 ， 得 
到 的 新 点 天 为 不 可 行 点 ， 根 据 可 行 
方向 法 的 搜索 策略 ， 应 改变 步 长 ， 
使 新 点 下 返回 到 约束 面 上 来 。 称 使 
新 点 于 恰好 位 于 约束 面 上 的 步 长 为 
最 大 步 长 ， 记 作 ayw， 则 本 次 达 代 
的 步 长 取 a'” = ay。 

由 于 不 能 预测 对” 点 到 另 一 个 
起 作用 约束 面 的 距离 ，ay 的 确定 
较为 困难 ， 大 人 致 可 按 以 下 步 又 
计算 。 

1) 取 一 试验 步 长 a,， 计算 试验 
点 站， 试验 步 长 的 值 不 能 太 大 ， 以 
免 因 一 步 走 得 太 远 导致 计算 困难 ; 
也 不 能 太 小 ， 使 得 计算 效率 太 低 。 
根据 经 验 ， 试验 步 长 a, 的 值 能 使 试 
验 点 忒 的 目标 函数 值 下 降 5% ~ 
10% 为 宜 ， 即 























图 5-19 ” 按 最 优 步 长 确定 新 点 





图 5-20 ”3 按 最 大 步 长 确定 新 点 
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ApF= 扎 素 9 ) -AX,) =(0.05 ~0.1)1f(X®)| (5-31) 
将 目标 也 数 作 对) 在 站 , 点 展开 成 泰勒 级 数 的 线性 式 
fX)=f(X" +aS )=fX )+[ VX )] aoS 


则 A = | "VR (5-32) 
由 此 可 得 试验 步 长 a, 的 计算 公式 : 
a = - 中 =(0.05 ~0. 1)—— AX )| (5-33) 








下 LA 
因 S$” 为 目标 函数 的 下 降 方向 ，[ VE ”)]7 8 ”<0， 所 以 试验 步 长 w 恒 为 
正 值 。 试 验 步 长 选 定 后 ， 试 验 点 不 按 下 式 计 算 : 
,=X +toS® (5-34) 
2) 判别 试验 点 站, 的 位 置 。 由 试验 步 长 a 确定 的 试验 点 马 可 能 在 约束 面 上 ， 
也 可 能 在 可 行 域 或 非 可 行 域 内 。 只 要 XX, 不 在 约束 面 上 ， 就 要 设法 将 其 调整 到 约束 
面 上 来 。 要 想 使 马 到 达 约 束 面 g;( 半 ”) (j=1,2,…,J) 是 很 困难 的 。 为 此 ， 先 确定 
一 个 约束 人 允 差 6。 当 试验 点 站 , 满足 
-6<g(X,)<0 (j=1,2,…,)) (5-35) 
的 条 件 时 ， 则 认为 试验 点 成 已 位 于 约束 面 上 。 
若 试 验 点 站 , 位 于 非 可 行 域内 ， 则 转 步 又 3) 。 
若 试验 点 马 位 于 可 行 域内 ， 则 应 沿 S ”方向 以 步 长 2w 继续 向 前 搜索 ， 直 至 新 
的 试验 点 蕊 到 达 约 束 面 或 超出 可 行 域 ， 再 转 步 又 3) 。 
3) 将 位 于 非 可 行 域内 的 试验 点 互 调整 到 
约束 面 上 。 
若 试验 点 闷 位 于 图 5-21 所 示 的 位 置 ， 在 
下 点 处 ，g1 (已 ) >0，8(X) >0。 显 然 应 将 了， 
点 调整 到 gj(X,) =0 的 约束 面 上 ， 因 为 对 于 马 
点 来 说 g1(X,) 的 约束 违反 量 比 g ( 世 ) 大。 知 
设 8 (已 ) 为 约束 违反 量 最 大 的 约束 条 件 ， 则 
esi(X ) 应 满足 
gr(¥,) = max|g,(X¥,) Ol mgd 
(5-36) 
将 试验 点 子 , 调整 到 g, (站 ,) =0 的 约束 面 上 
的 方法 有 试探 法 和 插值 法 两 种 。 
试探 法 的 基本 内 容 是 当 试 验 点 位 于 非 可 行 域 时 ， 将 试验 步 长 a, 缩短 ; 当 试验 
点 位 于 可 行 域 时 ， 将 试验 步 长 a, 增加 ， 即 不 断 变 化 a, 的 大 小 ， 直 至 满足 式 
(5-35) 的 条 件 时 ， 即 认为 试验 点 站 ,已 被 调整 到 约束 面 上 了 。 
图 5-22 所 示 框 图 表示 了 用 试探 法 调整 试验 步 长 a, 的 过 程 。 















gsX)-0 


XD 


图 5-21 违反 量 最 大 的 约束 条 件 
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图 5-22 用 试探 法 调整 试验 步 长 的 框图 


插值 法 是 利用 线性 插值 将 位 于 非 可 行 域 的 试验 点 马 调整 到 约束 面 上 。 设 试验 
步 长 为 w 时 ， 求 得 可 行 试验 点 着, = 对 ”+ aS ， 当 试验 步 长 为 w + ao 时 ， 求 得 
非 可 行 试验 点 并 = 于 ”+ (ao + oo)SW， 并 设 试验 点 生 , 笠 ,的 约束 函数 分 别 为 
gi( 半 1 ) <0，gi( 革 ,) <0， 它 们 之 间 的 位 置 关系 如 图 5-23 所 示 。 





8 AX ) 


gi(X1) 


图 5-23 用 插值 法 确定 试验 步 长 


知 考 虑 约束 允 差 6， 并 按 允 差 中 心 57/2 作 线 性 内 插 ， 可 以 得 到 将 于 "点 调整 到 约 
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束 面 上 的 步 长 a,， 其 计算 公式 为 





四 -0.56—g;(X,) 
3 (3 = 0 
本 次 迭代 的 步 长 取 为 
Q; =Qy =Q,+Q, (5-38) 


5. 收敛 条 件 

按 可 行 方向 法 的 原理 ， 将 设计 点 调整 到 约束 面 上 后 ， 需 要 判断 迭代 是 否 收敛 ， 
即 判 断 该 迭代 点 是 否 为 约束 最 优点 。 常 用 的 收敛 条 件 有 以 下 两 种 : 

1) 设计 点 下 及 约束 允 差 满足 





0 三 2， 
条 件 时 ， 和 迭代 收敛 。 
2) 设计 点 满足 库 恩 - 塔 克 (Kuhn-Tucker) 条 件 时 ， 和 迭代 收敛 。 
J 
Ne a gaa 
A=0 (=1,2,.…,)) 


J 


5.4.2 和 迭代 过 程 及 算法 框图 


1) 在 可 行 域 内 选择 一 个 初始 点 '”， 给 出 约束 人 允 差 6 及 收敛 精度 值 e。 
2) 令 迭 代 次 数 =0， 第 一 次 迭代 的 搜索 方向 取 S*” = - V(X )。 
3) 估算 试验 步 长 a,， 按 式 (5-34) 计算 试验 点 X,。 
4) 奉 试 验 点 和 ,满足 -6 <g,(X,) 0, 针 点 必 位 于 第 7 个 约束 面 上 ， 则 转 步 
又 6); 若 试 验 点 ,位 于 可 行 域 内 ， 则 加 大 试验 步 长 a,， 重 新 计算 新 的 试验 点 ， 
直至 已, 越 出 可 行 域 ， 再 转 步 又 3$); 车 试验 点 位 于 非 可 行 域内 ， 则 直接 转 步 又 
Sg 
5) 按 式 (5-36) 确定 约束 违反 量 最 大 的 约束 函数 g, ( 互 ) 。 用 插值 法 即 按 式 
(5-37) 计算 调整 步 长 a,， 使 试验 点 ,返回 到 约束 面 上 ， 则 完成 一 次 近代。 再 令 一 
5+1，9 = 不 转 下 一 步 。 
6) 在 新 的 设计 点 “处 产生 新 的 可 行 方向 S$ 。 
7) 若 圣 中 点 满足 收敛 条 件 ， 则 计算 终止 。 约 束 最 优 解 为 X* =, f(X*) = 
A 
否则 ， 改 变 允 差 6 的 值 ， 即 令 
, [5 [| WX TS Ss 
0 VAR YS 
可 行 方向 法 的 程序 框图 示 于 图 5-24。 








(5-41) 
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输入 Xt0、6、el、 


求 minfCX(OM+oS(0), XXO0)+ CsS(0) 


1 
本 O 十 SCXTP 1) 


< 一 一 一 一 w 
SC TD 一 SAD) 


KXOr OS 


计算 SC 六 1 2,…, m) 







构成 有 效 约束 集 / 
计算 ve(X0), VX) 











求 X 中 点 的 可 用 方向 $9 


XO WUDTC nS 
求 试验 步 长 0 


三 | 
< 一 = 


否 


并 


DD 
结束 


kktl 0 一 512 


图 5-24 可行 方向 法 的 程序 框图 
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S.S$.1 基本 原理 


惩罚 也 数 法 是 一 种 使 用 很 广泛 、 很 有 效 的 间接 解法 。 它 的 基本 原理 是 将 约束 优 
化 问题 
minf( X¥) 
s.t. g(X)<0 (j=1,2,.…,m) (5-42) 
h,(X)=0 (k=1,2,.…,/) 
中 的 不 等 式 和 等 式 约束 水 数 经 过 加 权 转 化 后 ， 和 原 目 标 消 数 结合 成 新 的 目标 函 
数 一 一 惩罚 函数 


pK,ri ,rs) = 所 是 ) +n > la,(X) tr 全 HL (X) ] (5-43) 


求解 该 新 目标 函数 的 无 约束 极 小 值 ， 以 期 得 到 原 问 题 的 约束 最 优 解 。 为 此 ， 按 一 定 
的 法 则 改变 加 权 因 子 r, 和 7, 的 值 ， 构 成 一 系列 的 无 约束 优化 问题 ， 求 得 一 系列 的 无 
约束 最 优 解 ， 并 不 断 地 通 近 原 约束 优化 问题 的 最 优 解 。 因 此， 惩罚 函数 法 又 称 序列 
无 约束 极 小 化 方法 ， 常 称 SUMT 法 。 


式 (5-43) 中 的 mn 并 GLg(X)] 和 习 H[h(X)] 称 为 加 权 转 化 项 。 根据 它 


们 在 惩罚 函数 中 的 作用 ， 又 分 别称 为 障碍 项 和 惩罚 项 。 障 碍 项 的 作用 是 当 迭 代 点 在 
可 行 域内 时 ， 在 迭代 过 程 中 阻止 迁 代 点 超出 可 行 域 。 签 罚 项 的 作用 是 当 人 迭代 点 在 非 
可 行 域 或 不 满足 不 等 式 约 束 条 件 时 ， 在 迭代 过 程 中 将 迫使 迭代 点 交 近 约束 边界 或 等 
式 约束 曲面 。 

根据 迭代 过 程 是 否 在 可 行 域内 进行 ， 德 鹿 函 数 法 又 可 分 为 内 点 惩 记 函数 法 、 外 
点 惩罚 函数 法 和 混合 惩罚 本 数 法 三 种 。 
5.5.2 外 点 惩罚 函数 法 

外 点 惩罚 函数 法 简称 外 点 法 。 这 种 方法 和 内 点 法 相反 ， 新 目标 函数 定义 在 可 行 
域 之 外 ， 序 列 和 迭代 点 从 可 行 域 之 外 逐渐 逼近 约束 边界 上 的 最 优点 。 外 点 法 可 以 用 来 
求解 含 不 等 式 和 等 式 约束 的 优化 问题 。 

对 于 约束 优化 问题 














minf( X¥) 
s.t. g;(X) O00U=1,2,.…,m) 
h,(X) =0(k=1,2,.…,/) 
转化 后 的 外 点 惩罚 函数 的 形式 为 


102 | 机 械 优化 设计 与 实例 


l 


各 六 二 江汉 + 1 max [0 a] tr D [OO (5-44) 
式 中 ，r 为 逢 罚 因子 ， 它 是 由 小 到 大 ， 目 赵 近 于 的 数列 ， 即 rw <r < < 一 
oo ;7 Pm! 0,g,(X)] ,T > [h,( 了 对) ] 分 别 为 对 应 于 不 等 式 约束 和 等 式 约束 函数 


的 乱 下 加 项。 
由 于 外 点 法 的 迭代 过 程 在 可 行 域 之 外 进行 ， 德 神 项 的 作用 是 迫使 迭代 点 到 
a 由 和 下 四 项 的 形式 可 知 ， 当 和 迭代 点 下 不 可 行 时 ， 惩 
罚 项 的 值 大 于 0。 使 得 惩 如 函数 KE,r) 大 于 原 目 标 冰 数 ， 这 可 看 成 是 对 迭代 
el | 种 恶 罚 。 当 和 迭代 点 离 约 束 边 界 越 远 ， 惩 罚 项 的 值 越 大 ， 
这 种 惩罚 越 重 。 得 当 渤 代 点 不 断 接近 约束 边界 和 等 式 约束 直面 时 ， 玉麟 项 的 值 
减 小 ， 且 趋 近 于 0， 惩 罚 项 的 作用 逐渐 消失 、 和 迭代 点 也 就 趋 近 于 约束 边界 上 的 
最 优点 了 。 
下 面 用 一 简 例 来 说 明 外 点 法 的 基本 原理 。 
例 5-1 用 外 点 法 求 问 题 














minf(¥) =x? + x 
s.t. g(X)=1-x,<0 
的 约束 最 优 解 。 

解 : 如 图 5-25 所 示 ， 该 问题 的 
约束 最 优点 为 X” = (0,1 ) ， 它 是 目 
标 函数 等 值 线 ， 即 圆 wt + x2 =1 和 约 
束 函 数 ， 即 直线 1 -x =0 的 切 点 ， 
最 优 值 为 几 XK ) =1。 用 外 点 法 求解 
时 ， 首 先 按 式 〈5-44) 构造 外 点 惩 
启 函 数 

p(X,r) SL 

对 于 任意 给 定 的 惩罚 因子 r(r > 
0)， 录 数 四 (下 ,7) 为 凸 函数 ， 用 解析 
法 求 $( 下 ,7) 的 无 约束 极 小 值 ， 即 令 
Vgp( 蒜 ,+r) =0 得 方程 组 

A =2 Mi -2r(1 -1) -0 图 525 例 5-1 图 解 








0 =0 
0 X» 





联 立 求解 得 kr (7) = 
十 地 
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Wy (TF) =0 

当 r=0.3 时 ,X” (Or) =(0.231,0 )', f(X*(r)) =0.053 

当 r=1.5 时 , XX*(r)=(0.6,0 ) , f(X"*(r))=0.36 

当 r=7.5 时 , 针 *(r) =(0.882,0) ，FX (Cr) ) =0.778 

当 r>w 时 , XX* (7)=(1,0)', f(X*(r))=1 

由 计算 可 知 ， 当 逐渐 增 大 7 值 ， 直 至 趋 近 +w 时 ,站 "(7) 台 近 原 约束 问题 的 最 
优 解 。 

当 r=0.3,，1.5, 7.5 时 ,惩罚 函 数 $(X,r) 的 等 值 线 图 分 别 示 于 图 5-26 a、 
b 、c。 

从 图 中 可 清楚 地 看 出 ， 当 > 逐渐 增 大 时 ， 无 约束 极 值 点 由 (X,r) 的 序列 ， 将 在 
可 行 域 之 外 逐步 逼近 约束 最 优点 。 








A 


RAR 





图 5-26 ”外 点 惩罚 函数 的 极 小 点 向 约束 最 优点 逼近 


OR | b) r=1.5， (| c) r=0.75, X* (7) 外 


外 点 法 的 惩罚 因子 按 下 式 递 增 
He) es BD (5-45) 
式 中 ,c 为 递增 系数 ， 通 常 取 c =5 ~10。 
与 内 点 法 相反 ， 惩 罚 因 子 的 初 值 "'” 若 取 相当 大 的 值 。 会 使 4( 半 ,7) 的 等 值 线 变 
形 或 偏心 ， 求 $( 竺 ,7) 的 极 值 将 发 生 困难 ， 但 ”取得 过 小 ， 势 必 增 加 迭代 次 数 。 所 
以 ,在 外 点 法 中 x 的 合理 取 值 也 是 很 重要 的 。 许 多 计算 表明 ， 取 r"'”=1, c=10 常 
常 可 以 取得 满意 的 结果 。 有 时 仅 用 下 面 的 经 验 公式 来 计算 值 : 


(0) _ (0) 2 
r =maxlr, 1(j=1,2,.…,m) 


s 0. 02 | 
式 中 ， Ee 人 (rel 
CR 




















104 | 机 械 优化 设计 与 实例 


外 点 法 的 收敛 条 件 和 内 点 法 相同 ， 其 计算 步骤、 程序 框图 也 与 内 点 法 相近 。 
5.5.3 内 点 惩罚 函数 法 

内 点 惩 广 函 数 法 简称 内 点 法 ， 这 种 方法 将 新 目标 函数 定义 于 可 行 域 和 内， 序列 迭 
代 点 在 可 行 域内 逐步 通 近 约束 边界 上 的 最 优点 。 内 点 法 只 能 用 来 求解 具有 不 等 式 约 
束 的 优化 问题 。 

对 于 只 具有 不 等 式 约 束 的 优化 问题 


























minf( X¥) 
| t 8 有 EN) <0(=1,2,.,m) B39 
转化 后 的 惩罚 国 数 形式 为 
到 一 7 ~ 1 
bX -AD -二 (5-47) 
或 
bX,r) = fAX) 一 2 ln ~ 8;(X)] (5-48) 


式 中 ,7 为 惩罚 因子 ， 它 是 由 大 到 小 且 趋 近 于 0 的 数列 ， 即 7 >r >r > … 一 0 
m 1 、 m 

= ln[ - &; (已 ) | 为 障碍 项 。 
> 5( 古 或 加 mL -8X) ] 为 障碍 萎 


由 于 内 点 法 的 迭代 过 程 在 可 行 域内 进行 ， 障碍 项 的 作用 是 阻止 迭代 点 越 出 
可 行 域 。 由 障碍 项 的 函数 形式 可 知 ， 当 迭代 点 徘 近 某 一 约束 边界 时 ， 其 值 趋 近 
于 0， 而 障碍 项 的 值 陡然 增加 ， 并 趋 近 于 无 穷 大 ， 好 像 在 可 行 域 的 边界 上 贷 起 
了 了 一道“ 围墙 ",， 使 迭代 点 始终 不 能 越 出 可 行 域 。 显 然 ， 只 有 当 惩 罚 因 子 7 一 0 
时 ， 才 能 求 得 在 约束 边界 上 的 最 优 解 。 下 面 仍 用 一 简 例 来 说 明 内 点 法 的 基本 
原理 。 

例 5-2 用 内 点 法 求 问 题 








minf(¥) =x? + x 
s.t. g(X)=1-x,<0 
的 约束 最 优 解 。 
解 : 前 面 已 用 外 点 法 求解 过 这 一 问题 ， 其 约束 最 优 解 为 X* =(1,0) ,f/f(X*)=1。 
用 内 点 法 求解 该 问题 时 ， 首 先 按 式 (5-48) 构造 内 点 惩罚 函数 
pK,r) =x1 + 一 rn(xi —1) 
对 于 任意 给 定 的 惩罚 因子 r(r>0) ， 国 数 由 ( 避 ,r) 为 凸 函数 。 用 解析 法 求 函 数 
中 车 ,r) 的 极 小 值 ， 即 令 YXK,r) =0 得 方程 组 
5 Xi 一 ~ Ta 














0 =0 


OX, 
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联 立 求解 得 
+ /1 +2r 


二 二 7 





(RE) 


当 和 (7) = 一 -人 于 全 时 不 满足 约束 条 件 g(X) =1 -x <0 应 舍 去 。 无 约束 极 


值 点 为 








1+ /1 +2r 
Xl (7) 一 7 
Wo =0 


r=4H; RX (ra(20) > HX (7)) =4 

lo (re (2 0 A (S2022 

当 r=0.36 时 ,，X”(r) =(1.156,0 ) , f(X"*(r))=1.336 

当 r=0 时 ; 2X" (7)=(1,0) ; f(X’(7))=1 

由 计算 可 知 ， 当 逐步 减 小 r+ 值 ， 直 至 趋 近 于 0 时 ，X"(7) 通 近 原 问题 的 约束 最 
优 解 。 

当 r=4，1.2，0. 36 时 ， 惩 罚 郴 数 7) 的 等 值 线 图 分 别 如 图 5-27a、b 、e 所 
示 。 从 图 中 可 清楚 地 看 出 ， 当 7 逐渐 减 小 时 ， 无 约束 极 值 点 对 "(7) 的 序列 ， 将 在 可 
行 域内 逐步 通 近 最 优点 。 





a) b) c) 
图 527 ”内 点 惩 如 因数 的 极 小 点 向 最 优点 通 近 
-4 xn)- 2 人 1. 422 _0.36, ¥* (1) 1. 156 
a) r=4, )=(,] ) 2 D =| ) c) r=0.36, D =| 6 】 


下 面 介绍 内 点 法 中 初始 点 '”、 惩 罚 因子 的 初 值 -'” 及 其 缩减 系数 c 等 重要 参数 
的 选取 和 收敛 条 件 的 确定 等 问题 。 
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1. 初始 点 对” 的 选取 

使 用 内 点 法 时 ， 初 始点 ”应 选择 一 个 离 约 束 边界 较 远 的 可 行 点 。 若 X'” 太 靠 
近 某 一 约束 边界 ， 构 造 的 惩罚 也 数 可 能 由 于 障 但 项 的 值 很 大 而 变 得 畸形 ， 使 求解 无 
约束 优化 问题 发 生 困难 。 程 序 设计 时 ， 一般 都 考虑 使 程序 具有 人 工 输 入 和 计算 机 日 
动 生成 可 行 初 始点 的 两 种 功能 ， 由 使 用 者 选用 。 计 算 机 自动 生成 可 行 初 始点 的 常用 
方法 是 利用 随机 数 生 成 设计 点 ， 该 方法 已 在 本 章 介 绍 过 。 

2. 惩罚 因子 初 值 ”的 选取 

惩罚 因子 的 初 值 "” 应 适当 ， 否 则 会 影响 迭代 计算 的 正常 进行 。 一 般 来 说 ，r"” 
太 大 ， 将 增加 迭代 次 数 ; ~” 太 小 ， 会 使 惩罚 函数 的 性 态 变 坏 ， 甚 至 难以 收敛 到 极 
值 点 。 由 于 问题 函数 的 多 样 化 ， 使 得 r”" 的 取 值 相当 困难 ， 目 前 还 无 一 定 的 有 效 方 
法 。 对 于 不 同 的 问题 ， 都 要 经 过 多 次 试 算 ， 才 能 决定 一 个 适当 的 r"” ， 以 下 的 方法 
可 作为 试 算 取 值 的 参考 。 

1) 取 r"” =1， 根 据 试 算 的 结果 ， 再 决定 增加 或 减 小 r” 的 值 。 

2) 按 经 验 公 式 























f(xX™) 
< 
2 BX 
计算 r™" 值 。 这 样 选 取 的 r'，” 可 以 使 惩罚 函数 中 的 障碍 项 和 原 目标 孔 数 的 值 大 致 相 
等 ， 不 会 因 障 但 项 的 值 太 大 而 起 文 配 作 用 ， 也 不 会 因 障 得 项 的 值 太 小 而 被 忽略 掉 。 

3. 惩罚 因子 的 缩减 系数 ec 的 选取 

在 构造 序列 惩罚 孔 数 时 ， 惩 罚 因 子 7 是 一 个 逐次 递减 到 0 的 数列 ， 相 邻 两 次 迭 
代 的 惩罚 因子 的 关系 为 


(5-49) 








=er’ (k=1,2,.…) (5-50) 
式 中 ，*e 称 为 惩 避 因子 的 缩减 系数 ，*e 为 小 于 1 的 正 数 。 一 般 的 看 法 是 ,c 值 的 大 小 
在 迭代 过 程 中 不 起 决定 性 作用 ， 通 第 的 取 值 范围 在 0.1 ~0.7 之 间 。 
4. 收 剑 条 件 
内 点 法 的 收敛 条 件 为 
p(X 【入 Ey — pb(X” Ce Sp 
bY" (rt-D ) 本 
[IX*(r™)-X(r" ")|s<e, (5352) 
前 式 说 明 相 邻 两 次 迭代 的 惩罚 函数 的 值 相对 变化 量 充分 小 ， 后 式 说 明 相 邻 两 
次 迁 代 的 无 约束 极 小 点 已 充分 接近 。 满 足 收银 条 件 的 无 约束 极 小 点 下 " (~”) 已 通 
近 原 问题 的 约束 最 优点 ， 和 迭代 终止 ， 原 约束 问题 的 最 优 解 为 忆 ” = 外 "(7 )， 
f(X*)=f(X"(r™))。 
内 点 法 的 计算 步骤 为 : 
1) 选取 可 行 的 初始 点 ”、 惩 罚 因 子 的 初 值 "”、 缩 减 系 数 c 以 及 收敛 精度 se、 





<el (5-51) 
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22， 令 迭 代 次 数 大 =0。 

2) 构造 惩罚 函数 由 (于 ,r) ， 选 择 适 当 的 无 约束 优化 方法 ， 求 函数 b(X,r) 的 无 
约束 极 值 ， 得 于 ” (~ ” ) 点 。 

3) 用 式 (5-51) 及 式 (5-52) 判别 迭代 是 否 收敛 ， 若 满足 收敛 条 件 ， 和 迭代 终 
上 止 。 约束 最 优 解 为 六 * 二 系 * (r® ) ， A = 人 否则 念 z%*? = ， 
YX = (1)。k=k+1 转 步 又 2)。 

内 点 法 的 程序 框图 如 图 5-28 所 示 。 













输入 X(O)、 /Vc El] \€ 


求 min V(X,， AD) 


满足 收敛 条 件 ? 
是 


XX (ND) 
fC ) AX (1D)) 










J 


XXX (ND) 


、 < 米 打 、 
和 S. 和 . 4 混合 惩罚 水 数 法 





混合 惩罚 函数 法 简称 混合 法 ， 这 种 方法 是 把 内 点 法 和 外 点 法 结合 起 来 ， 用 来 求 
解 同 时 具有 等 式 约束 和 不 等 式 约束 也 数 的 优化 问题 。 
对 于 约束 优化 问题 
minf( X¥) 
s.t. g;(X) O00=1,2,.…,m) 
h,(X) =0(k=1,2,.…,/) 
转化 后 的 混合 惩罚 函数 的 形式 为 
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WX) HE) -7 + RT (5-53) 





m 





式 中 ， rT > g ce 为 障 但 项 ， 惩罚 因子 7 按 内 点 法 选取 ， Ehr'®) >r'Y > 了 (2) > … 一 ”0 ; 
j=1 8 
1 
二 人 [h(X) ] 为 惩罚 项 。 惩 罚 因 子 为 二 ， 当 六 "0 时 ， 二 -om ， 满 足 外 点 法 对 征 
/r 三 /r 夺 
罚 因子 的 要 求 。 


混合 法 具有 内 点 法 的 求解 特点 ， 即 迭代 过 程 在 可 行 域内 进行 ,因而 初始 点 
于”、 惩 罚 因 子 的 初 值 ”” 均 可 参考 内 点 法 选取 。 计 算 步 又 及 程序 框图 也 与 内 点 法 


S.6 增 广 乘 子 法 


前 市 所 述 的 人 惩罚 函数 法 原理 简单 ， 算 法 易 行 ， 适用 范围 广 ， 并 且 可 以 和 各 种 有 
效 的 无 约束 最 优化 方法 结合 起 来 ， 因 此 得 到 广泛 应 用 。 但 是 ,惩罚 函数 也 存在 不 少 
问题 ， 从 理论 上 讲 ， 只 有 当 rr 一 % (外 点 法 ) 或 r 一 0 (内 点 法 ) 时 , 算法 才能 收 
和 敛 ， 因 此 序列 迭代 过 程 收银 较 慢 。 另 外 ， 当 惩罚 因子 的 初 值 ”” 取得 不 合适 时 ， 惩 
罚 函 数 可 能 变 得 病态 ， 使 无 约束 最 优化 计算 发 生 困难 。 

近年 来 提出 的 增 广 乘 子 法 在 计算 过 程 中 数值 稳定 性 、 计 算 效 率 上 都 超过 惩罚 闻 
数 法 。 目 前 ， 增 广 乘 子 法 在 理论 上 得 到 了 总 绪 提 高 ， 在 算法 上 也 积累 了 不 少 经 验 ， 
使 得 这 种 方法 日 益 完 善 。 

虽然 在 第 2 草 第 四 节 中 已 经 介绍 了 拉 格 明日 乘 子 法 ， 但 为 了 讨论 的 方便 ， 这 里 
再 简单 回顾 一 下 拉 格 朗 日 乘 子 法 ， 然 后 再 着 重 介绍 具有 等 式 约束 和 不 等 式 约束 的 增 
广 乘 子 法 的 算法 原理 和 步骤 。 


5.6.1 拉 格 明日 乘 子 法 


拉 格 朗 日 乘 子 法 是 一 种 古典 的 求 约束 极 值 的 间接 解法 。 它 是 将 具有 等 式 约束 的 
优化 问题 


























minf( X) 
1。 t. h, (A) =0(p=1,2,.…,/) 


转化 成 拉 格 庆 日 吨 数 
L(X,A) = f(X) + ,A,h,(¥) (5-54) 


用 解析 法 求解 式 (5-54)， 即 令 VL( 和 ,A) =0 可 求 得 隐 数 L( 半 ,和 A) 的 极 值 。 在 函数 
ZX,A) 中 ,AAA=(AA AI) 称 为 拉 格 明日 乘 子 ， 也 是 变量 ， 因 此 可 以 列 出 
(n +/) 个 方程 。 
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a 
O Xi 
oL 
一 一 =0 =]1.2..…./ 
OA, (p 9 9 ,1 ) 


联 立 求解 后 ， 可 得 (n +71) 个 变量 : 下 "= (好 ”= (AAA ,…， 
A，) ， 其 中 ,和 对 "为 极 值 点 ，A “为 相应 的 拉 格 朗 日 乘 子 向 量 。 
现 用 一 个 简单 的 例子 来 说 明 拉 格 庆 日 乘 子 法 的 计算 方法 。 
例 5-3 用 拉 格 明日 乘 子 法 求 问 题 
minf( ¥) =60 -10x —4 x, + XI +X? — XIX, 
s. t. h(E) =xXi +x, —8=0 
的 约束 最 优 解 。 
解 : 按 式 (5-54) 构造 拉 格 明日 函数 
L(X,A) =60 -10x -4x, +x? +x; — xix, 十 A(X 十 % —8) 
令 VL =0， 得 方程 组 


OX] 
O X2 


i +X,—8=0 


联 立 求解 ， 得 约束 最 优 解 
"el 3 I aly 

拉 格 明日 乘 子 法 求解 上 例 ， 看 起 来 似乎 很 徐 单 ， 实 际 上 这 种 方法 存在 着 许多 问 
题 ， 例 如 ， 对 于 非 凸 问题 容易 失败 ; 对 于 大 型 的 非 线 性 优化 问题 ， 需 求解 高 次 联 立 
方程 组 ， 其 数值 解法 几乎 和 求解 优化 问题 同样 困难 ; 此 外 ， 还 必须 分 离 出 方程 组 的 
重 根 。 因 此 ， 拉 格 朗 日 乘 子 法 用 来 求解 一 般 的 约束 优化 问题 不 是 一 种 有 效 的 方法 。 
5.6.2 等 式 约束 问题 

1. 基本 原理 

对 于 含 等 式 约束 的 优化 问题 


minf( X¥) 
人 t. 到 (有 下) =0 (p=1,2,.…,/) 




















构造 拉 格 明日 函数 
L(X,A) = f(X) + ,A,h,(¥) (5-55) 
当 令 VL( 和 ,A) =0 可 得 原 问题 的 极 值 点 下 以 及 相应 的 拉 格 明日 乘 子 回 量 A” ， 
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若 构造 外 点 惩罚 函数 
4(Xr) =fX) + LR) (5-56) 


当 r 一 % 时 ， 对 函数 由 (于 ,7r) 进行 序列 极 小 化 ， 可 求 得 原 问 题 的 极 值 点 "上 且 
h, (XX )=0 (p=1,2,.…,1)o 

前 已 述 及 ， 用 拉 格 朗 日 乘 子 法 求解 约束 优化 问题 往往 失败 ， 而 用 惩罚 函数 法 求 
解 ， 又 因 要 求 一 % 而 使 计算 效率 低 。 为 此 ， 将 这 两 种 方法 结合 起 来 ， 好 构造 亚 克 
函数 的 拉 格 明日 函数 


M(X,A,r) = f(X¥) | [h,(X) ?+ > 入 ,万 ( 妃 ) 
P=1 (5-57) 





l 
r 
= LX + OT 
若 令 
l 
VU(X,A) = VIX,A) +7D h(X) Vh,(X) =0 
p=1 


求 得 约束 极 值 点 半 " 且 使 h,(X* ) =0(p=1,2,…,/)， 所 以 ,不 论 r 取 何 值 , 式 
(5-57) 与 原 问题 有 相同 的 极 值 点 X" ,与 式 (5-55) 有 相同 的 拉 格 明日 乘 子 回 
量 A” 。 

式 (5-57) 称 增 广 乘 子 函 数 ， 或 称 增 广 德 广 函数 ， 式 中 的 7 仍 称 惩 广 因子 。 

既然 式 (5-55) 和 式 (5-57) ，。 和 A”。 仍 然 要 考虑 由 式 (5-57) 表 











示 的 增 广 乘 子 也 数 的 主要 原因 是 ， 这 两 类 函数 的 二 阶 导数 和 矩阵， 即 黑 塞 和 矩阵 的 性 质 
不 同 。 一 般 来 说 ， 式 (5-55) 0 函数 L( 对 ,和 A) 的 黑土 矩 阵 
H(X,A) -了 人 (5-58) 
并 不 是 正定 的 。 而 式 (5-57) 所 表示 的 增 广 乘 子 也 数 M(X,A,7) 的 黑 塞 和 矩阵 
oM Oh, oh, 
H(X,A,r) = ee H(X,A) + 允 业 和 人 =1,2,..,n) (5-59) 


必定 存在 一 个 r"， 对 于 一 切 满足 r 二 7" 的 值 总 是 正定 的 。 下 面 举 一 个 简单 例子 来 说 明 
上 述 结论 的 正确 性 。 
例 5-4 求 优化 问题 
minf( KR) =x? 一 3 x, — x 
二 
的 约束 最 优 解 。 
解 : 该 问题 的 约束 最 优 解 为 ”= (0,0 ) ，F(E  ) =0， 相 应 的 拉 格 朗 日 乘 子 
为 人 ”=3。 
构造 拉 格 朗 日 函数 
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L(KR,A) =xi -3 x, —x; +Ax, 


2 0 
其 黑 塞 逢 阵 为 万 = | _，] ， 且 其 在 全 平 而 上任 一 点 ， 包 括 X“ 处 ， 都 不 是 下 
定 的 。 
构造 增 广 乘 子 函数 
M(X,A,r) = 从 -3 入 一起 + 了 7T 吉 +A 六 
2 0 
其 黑 塞 短 阵 为 吾 = | 0 ，_，j， 当 到">2 时 ， 它 在 全 平面 上 处 处 正定 。 





由 这 一 性 质 可 知 ， 当 惩罚 因子 > 取 足 够 大 的 定 值 ， 即 + >r"， 不 必 趋 于 无 穷 大 ， 
且 恰 好 取 A 和 =A” 时 , 了 "就 是 函数 M( 站 ,A,7) 的 极 小 点 。 也 就 是 说 ， 为 了 求 得 原 问 
题 的 约束 最 优点 ， 只 需 对 增 广 乘 子 也 数 M( 半 ,A,7) 求 一 次 无 约束 极 值 。 当 然 ， 问 题 
并 不 是 如 此 简单 ， 因 为 A“ 是 未 知 的 ， 为 了 求 得 A“ 采取 如 下 方法 。 

假定 惩罚 因子 7 取 为 大 于 ”的 定 值 ， 则 增 广 乘 子 果 数 只 是 不 、A 的 函数 。 奋 不 
断 地 改变 入， 并 对 每 一 个 入 求 minM( 慰 ,和 A) ， 将 得 到 极 小 点 的 点 列 : "(A ) (k= 
1,2,…)。 

显然 ， 当 A 一 A 时, 对 ”= 对 "(A” ) 将 是 原 问 题 的 约束 最 优 解 。 为 使 A” 一 
A" ,采用 如 下 公式 来 校正 A : 











Pap (5-60) 
这 一 步骤 在 增 广 乘 子 法 中 称 为 乘 子 迭代 ， 是 惩罚 函数 法 中 所 没有 的 。 为 了 确定 
式 (5-60) 中 的 校正 量 A A ， 再 定义 
M(A) =M(X(A) ,A) (5-61) 
为 了 直观 地 说 明 水 数 W(A) 的 属性 ， 仍 然 从 分 析 例 S$-4 入 手 。 将 例 5-4 的 原 问 
题 构 造成 增 广 乘 子 函数 


M(R,A,r) = 和 一 3X — x + 十 入 Mo 





三 厅 (A=3)%;+ [S230 


若 取 r=6， 则 上 式 可 简化 为 
M(K,A) =xi + (A —3)x, +2 x 
对 于 求 函数 M(X,A) 的 极 值 ， 即 令 VM( 对 ,A) =0 得 方程 组 


es +4x,=0 


O %» 


联 立 方程 并 求解 得 
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ell 
0 = 
代 关 于 二 得 
MCA) = -3)(3 A) +3 A) 





4 

1 2 

+OA—9) 
> 

oNM_ 1 .3 

A 
解 得 

本 一 

ED | 
函数 W(A) 的 二 阶 导数 为 c .> = - 才 


<0， 可 见 和 ”=3 是 函数 MCA) 的 极 大 值 。 
M 


从 对 这 个 例子 的 分 析 可 知 ， 为 了 求 得 A”， 只 需求 函数 M(A ) 的 极 大 值 。 求 函 
数 M(A) 极 大 值 的 方法 不 同 ， 将 会 得 到 不 同 的 乘 子 迭代 公式 。 目 前 常 采 用 近似 的 牛 
顿 法 求解 ， 得 到 的 乘 子 迭代 公式 为 

NV Fh (pl) (5-62) 

2. 参数 选择 

增 广 乘 子 法 中 的 乘 子 向 量 入 、 惩 罚 因 子 r+、 设 计 变 量 的 初 值 都 是 重要 参数 。 下 
面 分 别 介 绍 选 择 这 些 参 数 的 一 般 方 法 。 

1) 在 没有 其 他 信息 的 情况 下 ， 初 始 乘 子 向 量 取 零 向 量 ， 即 A =0， 显 然 ， 这 
时 增 广 乘 子 函数 和 外 点 惩罚 函数 的 形式 相同 。 也 就 是 说 ， 第 一 次 迭代 计算 是 用 外 点 
法 进行 的 。 从 第 二 次 迭代 开始 ， 乘 子 癌 量 按 式 (5-62) 校正 。 

2) 惩罚 因子 的 初 值 "'”， 可 按 外 点 法 选取 。 以 后 的 授 代 计算 ， 惩罚 因子 按 下 式 


递增 























(0D (有 (k-1) 
h(X )/Ah(X >6 
k+l) 二 名 A ) (5-63) 


2 
式 中 ，B 为 惩 可 因子 递增 系数 ， 取 B =10; 6 为 判别 数 ， 取 6=0.25 。 

惩 刑 因子 的 递增 公式 可 以 这 样 来 理解 : 开始 途 代 时 ， 因 > 不 可 能 取 很 大 的 值 ， 
只 能 在 迭代 过 程 中 根据 每 次 求 得 的 无 约束 极 值 点 XX” 趋 近 于 约束 面 的 情况 来 决定 。 
当 X'" 离 约束 面 很 远 ， 即 上 (XX'”) 上 的 值 很 大 时 ， 则 增 大 7 值 ， 以 加 大 惩罚 项 的 作 
用 ， 迫 使 迭代 点 更 快 地 菊 近 约束 面 。 当 和" 已 接近 约束 面 ， 即 上 (XX) 明显 减 小 
时 ， 则 不 再 增加 ~ 值 了 。 

惩 昼 因子 也 可 以 用 简单 的 递增 公式 计算 : 

Re =pB A (5-64) 

这 一 公式 形式 上 和 外 点 法 所 用 的 公式 相同 ， 但 实质 上 不 同 。 因 为 增 广 乘 子 法 并 
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不 要 求 一 >o 。 事 实 上 ， 当 > 增加 到 一 定 值 时 ，A 已 趋 近 于 A” 。 从 而 增 广 乘 子 旺 数 
的 极 值 点 也 逼近 原 问题 的 约束 最 优点 了 。 用 式 (5-64) 计算 ”~ 时， 一 般 取 B =2 ~ 
4， 以 免 因 增加 太 快 ， 使 乘 子 迭代 不 能 充分 发 挥 作 用 。 

3) 设计 变量 的 初 值 X' 也 按 外 点 法 选取 ， 以 后 的 迭代 初始 点 都 取 上 次 迭代 的 
无 约束 极 值 点 ， 以 提高 计算 效率 。 

3. 计算 步骤 

1) 选取 设计 变量 的 初 值 X 7) 、 惩 罚 因子 初 值 -"'”、 增 长 系数 B 、 判 别 数 8 、 收 
敛 精度 =， 并 令 人 "=0(P =1,2,…,1) ， 迭 代 次 数 上 =0。 

2) 按 式 (5-57) 构造 增 广 乘 子 函数 M( 和 ,A,r) ， 并 求 minM(X ,Ar) ， 得 无 约 
束 最 优 解 X” =" (A ,r")。 

3) 计算 





l 


axo) l= {BEI} 


p 
4) 按 式 (5-62) 校正 乘 子 向 量 ， 求 AGrD 。 
3 ) 如 果 |&( 瑟 人) | 大 e， 则 迭代 终止 。 约 束 最 优 解 为 四" = ，A”* = AGO3D ， 
否则 转 下 一 步 。 
6) 按 式 (5-63) 或 式 (5-64) 计算 征 罚 因子 +** ?了 ， 再 今 上 = 下 +1 转 步 又 2。 


5.6.3 不 等 式 约 束 问 题 


对 于 含 不 等 式 约 束 的 优化 问题 
minf( X¥) 
wm g(X)<0 (f=1,2,.,m) 
引进 松弛 变量 Z = C3 Z>，""'， i 并 日 令 
(人 
于 是 ， 原 问题 转化 成 等 式 约束 的 优化 问题 
minf( X¥) 
je ag!(¥X,2Z) <0 (j=1,2,,m) 
这 样 就 可 以 采用 等 式 约束 的 增 广 乘 子 法 来 求解 了 。 取 定 一 个 足够 大 的 r(r >7') 
后 ,， 式 (5-65) 的 增 广 乘 子 饵 数 的 形式 为 
M(X,Z,A) = /(X) + > Ag'(X,Z) De > [a 2 (5-66) 


并 对 一 组 乘 子 向 量 A” (初始 乘 子 向 量 仍 取 零 向 量 ) 求 minM (站,Z,A)， 得 
瑟 ”= 于" (A ) ，ZX… =2Z* (A )， 再 按 式 (5-62) 计算 新 的 乘 子 向 量 
是 
将 增 广 乘 子 函数 的 极 小 化 和 乘 子 迭代 交替 进行 ， 直 至 天、Z 和 和 分 别 趋 近 于 
pO A 1 








(5-65) 
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虽然 从 理论 上 讲 ， 这 个 计算 过 程 与 仅 含 等 式 约 束 的 情形 没有 什么 两 样 ， 但 由 于 
增加 了 松弛 变量 Z， 使 原来 的 n 维 极 值 问 题 扩 充 成 n+m 维 问 题 ， 热 必 增 加 计算 量 
和 求解 的 困难 ， 有 必要 将 计算 加 以 简化 。 

将 式 (5-66) 所 示 的 增 广 乘 子 孔 数 改 写成 

M(X,Z,A) = f(X) + 2 A(8(X) + 入) 2 [g(X) +z#] (5-68) 

利用 解析 法 求 孙 数 W(XK,Z,A) 关 于 2 的 极 值 ， 即 令 YM( 半 ,Z ,A) =0 可 得 

z[A;+r(g;(¥) + 二 ) ] =0 (7 SZ 

行人 +r&i( 疏 ) 二 0， 则 2 

车 Aj +rg(X) <0, 则 = -[(A/r) + 可 (五 ) ] 





?= {max[0, — (A+rg(X))]) (=1,2,,m) (5-69) 
将 式 (5-69) 代入 式 (5-68)， 得 
M(X,A) = f(X) + 并 max [ON + rg(X)] -| (5:70) 


这 就 是 不 等 式 约束 优化 问题 的 增 广 乘 子 函 数 ， 它 与 式 (5-68) 的 不 同 之 处 在 

于 松弛 变量 Z 已 经 完全 消失 了 。 实 际 计算 时 ,仍然 只 需要 对 给 定 的 入 及 r， 求 关于 
的 无 约束 极 值 minM( 瑟 ) 。 将 式 (5-69) 代入 式 (5-67) ， 得 到 乘 子 迭代 公式 

0 = max10,A 人 0 +rg(X)) (=1,2,…,m) (5-71) 


5.6.4 菩 有 等 式 和 不 等 式 约束 问题 
对 于 同时 具有 等 式 约束 和 不 等 式 约 束 的 优化 问题 
minf( X) A ee ce, 
S. t. g;(X) =g,(XI Fs <0(]=1,2,.…,m) 
h,(X) = 用 (XXXno) =0(p=1,2,.…,7) 
构造 的 增 广 乘 子 函数 的 形式 为 
M(X,Ar) = A(X) + py [max [0,Ay +rg(X) ]2 -2% 


yy 














生生 
(5-72) 


也 Le > [h,(X) ]? 
式 中 ，A ,为 不 等 式 约束 函数 的 乘 子 向 量 ; 和; 为 等 式 约束 函数 的 乘 子 向 量 。 
Ay 和 A 的 校正 公式 为 
Ah =max[0,Ar +rg(K)] (=1,2,.…,m) 
en 
算法 的 收敛 条 件 可 视 乘 子 向 量 是 否 稳定 不 变 来 决定 ， 如 果 前 后 两 次 迭代 的 乘 子 


(5-73) 
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向 量 之 差 充 分 小 ， 则 认为 迭代 已 经 收敛 。 
增 广 乘 子 法 的 程序 框图 如 图 5-29 所 示 。 












4<0 r<r(0)、 k<—0 


构造 增 广 乘 子 函 数 M(X, 4 ,7) 
求 minM(X, 4,7) 








re — max[0, 10) +rg,(X)] ( 庆 1, 2, ……,， 1m) 
> 0 4 +rhp(X) (p=1, 2, ……, D) 












< XD 





满足 收敛 条 件 ? 








否 
HD Br 


图 5-29 ” 增 广 乘 子 法 的 程序 框图 





5.7 约束 优化 设计 实例 


例 5-5 求 约束 优化 问题 
minf(¥) =x? +x, 
s.t gi (有) = +x; -9<0 
gy(X) =Xi +x,—1<0 
的 最 优 解 。 
解 : 用 随机 方 回 法 程序 在 计算 
机 上 运行 ， 共 迭代 13 次 ， 求 得 的 
约束 最 优 解 为 X = (- 0.002， 
-3. 0) , /A(X*)= -3, 计算 机 
计算 的 结果 摘录 于 表 5-1， 该 问 
题 的 图 解 示 于 图 5-30。 图 5-30 例 5-5 图 解 
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表 5-1 例 5-5 的 计算 结果 




















k Xi1l 32 /(X) 
0 —2.0 2.0 6.0 
1 一 0. 108 1. 117 1. 190 
4 一 0. 033 1. 024 1.025 
7 —0.114 0.717 0. 730 
10 一 0. 077 一 2. 998 一 2. 997 
13 一 0. 002 -3.0 -3.0 











例 5-6 用 复合 形 法 求 约束 优化 问题 
minf(X) =(x, -5 ) +4(x， 一 6 
s.t. gi (KR) =64-x? -好 和 0 
g() =x, -x -10<0 
g3(X¥) =x, -10<0 
的 最 优 解 。 
解 : 用 复合 形 法 程序 在 计算 机 上 运行 ， 共 迭代 67 次 。 求 得 的 约束 最 优 解 为 X*”= 
(5.21975 6.06253) , f( 半 ") =0.06393， 计算 机 计算 的 结果 摘录 于 表 5-2， 该 问 
题 的 图 解 示 于 图 5-31。 








初始 复合 形 





图 5-31 例 5-6 图 解 
表 5-2 例 5-6 的 计算 结果 


Xl %2 /(X) 





8 14 100 











10 4. 43321 6. 90164 3. 57084 
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续 ) 

k Xl 22 f(X) 

20 5.35314 6. 68238 1. 98728 
30 5. 58604 6. 06063 0. 35813 
40 5.25561 6. 06049 0. 07997 
50 5. 20952 6. 07303 0. 06523 
60 5.21975 6. 06253 0. 06402 
67 5.21975 6. 06253 0. 06393 





例 5-7 用 可 行 方向 法 求 约束 优化 问题 
minf( ¥) =60 -10x —4 x +X? +X7 — XN, 

s.t. gi(¥)= -x,<0 

g() = -x,<0 

g3( 半 ) =xi -6<0 

gi(X) =x, -8<0 
gs(X) =x, +Xi -11l<0 


的 约束 最 优 解 。 

解 : 为 了 进一步 说 明 可 行 方向 法 
的 原理 ， 求 解 时 将 先 采 用 优选 方向 法 ， 
后 采用 梯度 投影 法 来 确定 可 行 方向 。 
该 问题 的 图 解 如 图 5-32 所 示 。 

取 初 始点 对 ”= (0,1 ) 为 约束 边 
界 gi( 圣 ) =0 上 的 一 点 。 第 一 次 迭代 用 
优选 方向 法 确定 可 行 方向 。 为 此 ， 首 
先 计算 对 点 的 目标 函数 成 和 ) 和 约 
束 函数 g, (XX'"” ) 的 梯度 : 


VY) -| 一 10 +2 x | -| a 








—4 +2 xXx, —Xi 
(0) -1 
Vei(X 六 兰 | | 


为 在 可 行 下 降 扇 形 区 内 寻找 最 优 
方向 ， 需 求解 一 个 以 可 行 方向 和 = 














图 5-32 例 5-7 图 解 





(3$, ,S,) 为 设计 变量 的 线性 规划 问题 ， 其 数学 模型 为 
min [ VF(X)]IS=115S| -2 9， 
st [Vs(XEO)]7S= -5S,<0 


Xl 
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[ VACXY)]'S=11S, -25,<0 

ST +S;1 
现 用 图 解法 求解 ， 如 图 5-33 所 示 ， 最 优 方向 是 $”= (0. 984,0. 179 ) ， 它 是 目标 函 
数 等 值 线 〈 直 线束 ) 和 约束 函数 S; + 5; =1 (半径 为 1 的 圆 ) 的 切 点 。 第 一 次 迭代 
的 可 行 方向 为 $ "=$S” ， 若 步 长 取 w … =6. 098， 则 


X0 =Xo trams -人 ] +6098( 170) = | 2 
1 0. 179) \2.092 





图 5-33 ”用 线性 规划 法 求 最 优 方 回 





可 见 第 一 次 迄 代 点 在 约束 边界 g; (XX ) =0 上 。 
第 二 次 迭代 用 梯度 投影 法 来 确定 可 行 方向 。 扩 代 点 XX 的 目标 函数 负 梯 度 
- V(X ) = (0.092,5. 816 ) "不 满足 方向 的 可 行 条 件 。 现 将 - W(X ) 投 影 到 约 
束 边界 g;( 科 ) =0 上 ， 按 式 (5-29) 计算 投影 算 子 
用 


ea 


本 次 迭代 的 可 行 方 加 为 


SO -二 忆 VE ) 
lIP YX 1 -人 


显然 ，$ 为 沿 约束 边界 ge; (下 ) =0 的 方向 。 若 取 a' ”=2.909， 则 本 次 迭代 点 


人 | 一 oo 昌 














对 > 二 万 (D) 二 Sb 
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6 
即 为 该 问题 的 约束 最 优点 X* ， 则 得 约束 最 优 解 X”= | > ,AX ii, 


例 5-8 试用 混合 昼 函 数 法 求 点 集 4(%i ,x ,zs ) 和 点 集 B(x%4 ,xs ,x6) 之 间 的 最 短 

距离 。 限 制 条 件 为 
X1 +X + X35 
(x4 -3) +xs<1 
4<x6<8 

分 析 由 图 5-34 可 知 xi +x2 +x3 夺 5 表示 以 原点 为 球 心 、 半 径 为 请 的 球体 ， 点 
集 A(x ,2 ,x ) 在 球面 上 取 点 。(%s -3 )+ 妇 入 1，4 友 2 过 8 表示 一 圆柱 体 ， 点 集 
B(xw ,xs ,zo ) 在 圆柱 面 上 取 点 。 因 此 该 问题 就 是 求 这 两 个 几何 体 间 的 最 短 距 离 的 约 
束 优化 问题 ， 其 数学 模型 为 

















图 5-34 例 5-8 图 解 


minf(X) = (x -x4) + (Xs -Xs) + (x —Xe)” 
s.t. gi(X)=x? +x2 + -5<0 
g2(X) =(x4 -3 ) +xs—-1<0 
g3(X) =x -8<0 
gi(X) =4-x,<0 
解 : 用 混合 法 程序 计算 时 ， 取 X"” =(1,1,1,3,1,5 ) ,r”=1, c=0.2 在 计 
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算 机 上 运行 ， 共 迭代 13 次 ， 求 得 的 最 优 解 为 X= (1.0015,，- 0. 0035 ,1. 999 ,2. 0， 
0. 0077 ,4. 07) ,，f/( 脏 ") =5$.008。 和 理论 解 区 = (1,0,2,2,0,4)，,，f/(X")=5 比 
较 ， 误 差 很 小 。 
例 5-9 用 增 广 乘 子 法 求 问 题 
1 > 


minf( XX) = 3 (4 + 3 中 | 


s.t. h(X)=x, +x,—1=0 
的 约束 最 优 解 。 
解 : 这 个 问题 的 精确 解 为 X*”= (0.25 ,0.75 ) ,A(X” ) =0.125。 相 应 的 乘 子 向 
量 为 人 ”=0. 25 。 
按 式 (5-57) 构造 增 广 乘 子 函 数 








a | + 本 当 ] A (+t 1) + 二 (二 二) 
用 解析 法 求 MK(XK,A,r) ， 即 令 VM(CX,A,r) =0 可 得 最 优 解 
六 (有 A 
二 
全 -Tar 
由 _3(r -A) 
> (CD 
1 +47 


取 r"” =0.1, B6=2，A'”=0，, 于 "0) =(0.0714 ,0.2142 ) ， 共 人 迭代 6 次 得 到 最 优 
解 : X ”= (0. 2499 ,0.7499) ,fA(X*) =0.125， 和 精确 解 相 比 ， 误 差 很 小 。 


第 6 草 多 目标 明 数 优化 方法 


6.1 概述 





在 优化 设计 中 ， 有 时 往往 不 止 一 项 设计 指标 要 求 最 优化 ， 而 是 同时 要 求 考虑 多 
个 目标 都 达到 优化 。 例 如 ,设计 一 全 齿轮 机 个 ， 常 弟 希 望 它 的 重量 尽 可 能 轻 ， 制 造 
成 本 尽 可 能 低 ， 同 时 还 要 求 它 的 噪声 尽 可 能 小 ， 寿 命 尽 可 能 长 ， 这 种 同时 要 求 几 项 
设计 指标 都 达到 最 优 的 问题 ， 称 为 多 目标 优化 设计 问题 。 

按照 上 述 多 项 优化 指标 ,我们 可 对 齿轮 变速 箱 的 设计 分 别 建立 下 列 分 目标 











也 数 : 
1) 要 求 结 构 紧 竣 ， 使 重量 总 和 fi; (站 ) 尽 可 能 轻 
2) 要 求 减少 材料 消耗 ,使 成 本 总 和 f;( 半 ) 尽 可 能 低 。 
3) 要 求 制造 和 传动 精度 较 高 ， 使 运转 噪声 六 ( 天 ) 尽 可 能 小 。 

4) 要 求 各 类 零件 强度 较 高 ， 使 寿命 六 X) 尽 可 能 长 。 

按照 上 述 要 求 ， 在 满足 约束 条 件 的 情况 下 ,使 建立 的 四 个 目标 函数 都 达到 最 
优 。 可 归纳 为 如 下 表达 式 : 

VminF(X) = min(f (X) F(X) LK) 大 CD" 
st g(X)<00U=1,2,.…,m) 
h,(X) =0(k=1,2,.…,/) 

一 般 而 言 ， 春 有 世 个 目标 函数 和 者 干 个 约束 条 件 ， 其 中 于 es 了 R" ， 则 多 目标 优化 

问题 的 表达 式 可 归纳 为 
VminF(X) = min(f (X) F(X) ,7 fX)) 
st g(X)<0U=1,2,.…,m) 
h, (KX) =0(k=1,2,.…,/) 

式 中 ，F( 半 ) =min( 有 (站 ) ,pp (站 ) ,… ,fi( 半 ) ) 为 向 量 目标 函数 ; 了 一 minF(X) 为 多 
目标 极 小 化 数学 模型 采用 回 量 形式 的 简写 ; VV- min 为 辐 量 极 小 化 表示 ， 即 问 量 日 
标 函 数 玉 下 ) = min( 及 (下 ) ,万 ( 避 ) ,…,f( 下 )) 中 各 个 目标 函数 被 同等 地 极 小 化 的 意 
思 ; st gj( 慰 ) 志 0(j=1,2,…,m) 和 hi( 剧 ) =0(k=1,2,…,1) 为 设计 变量 X" 应 满足 
的 所 有 约束 条 件 。 

多 目标 优化 问题 的 求解 与 单 目标 优化 问题 的 求解 有 着 根本 的 区 别 ， 对 于 单 目 标 
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优化 问题 ， 任 何 两 个 解 都 可 以 用 其 目标 函数 比较 出 方案 的 优 劣 。 但 是 ， 对 于 多 目标 
优化 问题 ， 任 何 两 个 解 不 一 定 可 以 比较 出 优 务 。 一 般 而 言 ， 单 目标 优化 问题 中 得 到 
的 是 最 优 解 ， 而 多 目标 优化 问题 中 得 到 的 可 能 只 是 非 劣 解 (或 称 有 效 解 )， 而 非 劣 
解 往往 不 止 一 个 。 如 果 一 个 解 使 每 个 分 目标 函数 值 都 比 为 一 个 解 为 劣 ， 则 这 个 解 为 
劣 解 。 显 然 多 目标 优化 问题 只 有 求 得 最 好 的 非 劣 解 时 才 具 有 意义 。 

多 目标 优化 设计 问题 原则 上 要 求 各 分 量 目 标 都 达到 最 优 ， 如 能 获得 这 样 的 结 
末 ， 当 然 是 十 分 理想 的 。 但 是 ， 事 实 上 解决 多 目标 优化 设计 问题 是 一 个 比较 复杂 的 
问题 ， 尤 其 是 在 各 个 分 目标 的 优化 相互 让 盾 ， 甚 至 相互 对 立时 更 是 如 此 。 例 如 上 例 
中 ,在 使 精度 和 强度 尽 可 能 提高 的 同时 ， 均 会 使 总 成 本 增加 。 

在 这 里 ， 各 分 目标 函数 的 优化 已 明显 发 生 了 相互 的 让 盾 和 对 立 。 要 解决 这 个 问 
题 ， 就 要 对 各 个 分 目标 进行 协调 ， 使 其 互相 做 出 些 “ 让 步 " ， 以 得 到 对 各 目 分 目标 
要 求 都 比较 接近 的 、 比 较 好 的 最 优 方案 。 

近年 来 国内 、 外 学 者 虽然 对 多 目标 优化 问题 做 了 许多 研究 ， 提 出 了 不 少 解决 的 
方法 ， 但 比 起 单 目 标 优化 设计 问题 ， 在 理论 上 和 计算 方法 上 还 很 不 完善 ， 也 不 够 系 
统 。 本 章 将 在 前 述 各 章 单 目标 优化 方法 的 基础 上 ， 扼 要 介绍 多 目标 优化 设计 方法 的 
一 些 基本 概念 、 求 解 思路 和 处 理 方 法 。 

多 日 标 优化 的 求解 方法 很 多 ,其 中 最 主要 的 有 两 大 类 。 一 类 是 下 接 求 出 非 劣 
解 ， 然 后 从 中 选择 较 好 解 。 另 一 大 类 是 将 多 目标 优化 问题 在 求解 时 做 适当 的 处 理 。 
处 理 的 方法 又 可 分 为 两 种 : 一 种 处 理 方法 是 将 多 目标 优化 问题 重新 构造 一 个 师 数 ， 
即 评价 函数 ， 将 多 目标 优化 问题 转变 为 求 评价 函数 的 单 目标 优化 问题 ; 另 一 种 是 将 
多 目标 优化 问题 转化 为 一 系列 单 目 标 优化 问题 来 求解 。 属 于 这 一 大 类 求解 的 前 一 种 
方法 有 : 主要 目标 法 、 线 性 加 权 组 合法 、 理 想 点 法 、 分 目标 乘除 法 等 。 属 于 后 一 种 
的 方法 有 分 层 序 列 法 、 宽 容 分 层 序列 法 等 。 下 面 简 要 介绍 这 几 种 用 评价 本 数 处 理 多 
目标 优化 问题 的 方法 。 















































6.2 统一 目标 函数 法 





统一 上 日 标 函 数 法 的 实质 就 是 将 原 各 分 日 标 滑 数 放 (站 ) ， 户 (于 ) ，…， 太 (于 ) 通 过 
一 定 的 方法 ， 统 一 到 一 个 新 构成 的 总 的 统一 目标 函数 F(X) = (fi(X) ,fp(X),…， 
万 \XE)) 中 ， 把 原来 的 多 目标 优化 问题 转化 成 具有 统一 目标 郴 数 的 单 目 标 优化 问题 ， 
然后 再 用 前 述 的 单 目标 函数 优化 方法 求解 。 

在 求 统 一 日 标 函 数 最 小 化 的 过 程 中 ， 可 以 应 用 不 同 的 方法 来 构成 不 同 的 上 日 标 汤 
数 。 其 中 较 稼 用 的 有 线性 加 权 组 合法 、 理 想 点 法 、 分 目标 乘除 法 。 


6.2.1 线性 加 权 组 合法 
线性 加 权 组 合法 又 称 加 权 因 子 法 ， 即 在 将 多 目标 浮 数 组 合成 总 的 “统一 日 标 
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国 数 ”的 过 程 中 ， 引 入 加 权 因 子 配 ， 以 考虑 各 个 分 目标 函数 在 相对 重要 程度 方面 
的 差异 以 及 在 量 级 和 量 纲 上 的 差 寞 。 

此 法 考虑 到 多 目标 优化 问题 式 (6-1) 中 各 个 分 目标 函数 (XX),， (于 ) ，…， 
万 ( 避 ) 的 重要 程度 ， 对 应 地 选择 一 组 加 权 因 了 于 本 ， 瑟 ，…， 了 玉 ， 当 各 项 分 量 有 相 
同 的 重要 性 时 ， 可 取 瑟 =1(i=1,2,…,L)， 并 称 其 为 均匀 计 权 ; 和 否则， 可 取 瑟 =0 
的 其 他 值 ， 并 表达 为 











W,=1 或 WW=0(i=1,2,…,L) (62) 
再 用 f( 半 ) 与 W.(i=1,2,…,L) 的 线性 组 合 构 成 一 个 新 的 评价 函数 
WY). WY) (6-3) 


如 寿 将 多 目标 优化 问题 转化 为 单 日 标 优化 问题 ， 即 求 评价 函数 的 最 优 解 辫 ”， 

则 式 (6-3) 可 写 为 
minF(X) 三 min 2 W.f.(X¥) | (6-4) 

这 样 ， 就 使 原来 的 多 目标 优化 问题 合理 地 转化 为 单 日 标 优化 问题 ， 而 且 此 单 日 
标 优 化 问题 的 解 又 是 原 多 目标 优化 问题 比较 好 的 非 劣 解 。 

对 于 加 权 因 子 于 的 选取 ， 要 求 比较 准确 地 反映 各 个 分 目标 对 整个 多 目标 问题 
的 重要 程度 和 对 各 目 不 同 的 估价 和 折 中 。 下 面 介绍 一 种 确定 加 权 因 子 的 方法 。 这 种 
方法 是 将 式 (6-4) 中 各 单 目标 最 优化 值 的 倒数 取 作 加 权 因 子 。 

即 














Wl h(E UL 2 (6-5) 

JJ) = minfi(X) 二 2 了) (6-6) 

此 种 方法 在 确定 加 权 因 子 时 ， 只 需 领 先 求 出 各 个 单 目标 最 优 值 ， 无 须 其 他 信 

息 ， 同 时 又 反映 了 各 个 单 目标 函数 值 离开 各 自 最 优 值 的 程度 。 因 此 ， 适 用 于 同时 考 

虑 所 有 目标 或 各 目标 在 整个 问题 中 有 同等 重要 程度 的 场合 。 此 法 也 可 理解 为 对 各 个 

分 目标 孔 数 做 统一 量 纲 处 理 。 这 时 在 列 出 统一 目标 孔 数 时 ， 不 会 受 各 分 目标 值 相对 

大 小 的 影响 ， 能 充分 反映 出 各 分 目标 在 整个 问题 中 有 同等 重要 含义 。 若 各 个 分 目标 

重要 程度 不 相等 ， 则 可 在 上 述 统一 量 纲 的 基础 上 再 另外 赋 以 相应 的 加 权 因 子 值 。 这 

样 ， 加 权 因 子 的 相对 大 小 ， 才 充分 反映 出 各 分 目标 在 整个 优化 问题 中 的 相对 重要 
程度 。 


6.2.2 目标 规划 法 


这 个 方法 的 基本 思想 是 先 定 出 各 个 分 目标 函数 的 最 优 值 ， 根 据 多 目标 优化 设计 
的 总 体 要 求 对 这 些 最 优 值 做 适当 调整 ， 定 出 各 个 分 日 标的 最 合理 值 /*” (i =1,2,…,L)， 
然后 按 如 下 的 平方 和 法 来 构造 统一 目标 郴 数 
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AX) = 二 | (677) 


这 意味 着 当 各 项 分 目标 函数 分 别 达 到 各 自 最 合理 值 (” 时， 统一 目标 函数 (六) 
为 最 小 。 式 中 除 以 /使 之 无 量 纲 化 。 
在 目标 规划 法 中 ， 关 键 是 如 何 制 定 恰当 的 合理 值 /”。 


6. 2.3 功效 系数 法 


将 每 个 分 目标 函数 f;( 于 ) (i=1,2,…, 工 ) 虱 用 一 个 称 为 功效 系数 ni;(i=1,2,… 
L) 来 表示 该 项 指标 的 好 坏 。 功 效 系 数 m; 是 一 个 定义 于 0 ni 二 1 之 间 的 函数 ， 当 
ni=1 时 表示 第 i 个 分 目标 的 效果 达到 最 好 ，”m; =0 时 表示 第 i 个 分 目标 的 效果 最 坏 ， 
将 这 些 系数 的 几何 平均 值 称 为 总 功效 系数 了 7， 即 
































7 一 /mn (6-8) 
7 的 大 小 可 表示 该 设计 方案 的 好 坏 ， 显 然 ， 最 优 设计 方案 应 是 
n= NI1M2° "NL Nax (6.9) 








当 m=1 时 表示 取得 最 理想 方案 ; 当 7 =0 时 表明 这 个 方案 不 能 接受 ， 此 时 必 
有 某 项 分 目标 函数 的 功效 系数 n; =0。 

图 6-1 给 出 了 儿 种 功效 系数 函数 曲线 ， 其 中 图 6-1a 表示 与 (XX) 值 成 正比 的 功 
效 系数 n; 的 函数 ,图 6-1b 表示 与 (下 ) 值 成 反比 的 功效 系数 nm; 的 函数 ， 图 6-1le 表示 
f:( 亿 ) 值 过 大 或 过 小 都 不 行 的 功效 系数 函数 。 在 具体 使 用 这 些 功 效 系数 函数 时 应 做 
出 相应 的 规定 。 例 如 ， 规 定 m; =0.3 为 可 接受 方案 的 功效 系数 下 限 ，0.3 <”; 专 0.4 
为 较 差 情况 ; 0.4 < ”; 夺 0.7 为 效果 稍 差 但 可 接受 的 情况 ; 0.7 < 人 ;大 1 为 效果 最 好 


的 情况 。 
~ Tt [A 


2 BB HO © 六 /0) 0 





B /0) 
a) c) 


图 6-1 功效 系数 函数 曲线 


用 总 功效 系数 7 作为 统一 目标 也 2 
F(R)=n= 190°*"Nn .max (6-10) 
比较 直观 有 旦 易 调 整 ， 同 时 由 于 各 个 分 目标 最 终 都 化 为 0 ~1 间 的 数值 ， 各 个 分 目标 
水 数 的 量 纲 不 会 互相 有 影响， 而 且 一 旦 有 一 项 分 目标 孔 数 不 理想 (7; =0) 时 ， 其 总 
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功效 系数 必 为 零 ， 表 示 该 设计 方案 不 能 接受 。 为 外 ， 这 种 方法 易于 人 处理， 有 的 目标 
呐 数 既 不 是 越 大 越 好 ， 也 不 是 越 小 越 好 的 情况 。 因 而 虽然 计算 较 蒙 、 但 仍 不 失 为 一 
种 有 效 的 多 目标 优化 方法 。 


6.2.4 分 目标 乘除 法 


在 多 目标 优化 问题 中 ， 有 一 类 属于 多 目标 混合 优化 问题 。 如 目标 藉 数 值 靖 ( 瑟 ) 
越 小 越 好 ( 如 成 本 类 目标 值 ) 和 目标 函数 值 户 ( 和 站) 越 大 越 好 ( 如 效益 类 目标 值 )， 
且 前 者 有 7r 项 ,后 者 有 (LL-r) 项 ， 则 其 优化 模型 为 

minF"'(X¥) 
V-maxr”(X¥) (6-11) 
XeR” 














FA CE) (Xs CY) 
P(X) Eat a 
求解 上 述 优化 模型 的 方法 可 将 模型 中 的 各 分 目标 函数 进行 相 情 和 相 除 处 理 后 ， 
再 在 可 行 域 上 进行 求解 。 





5 F(X) 
U(X) = 二 一 >min (6-12 ) 
EF(X) 
显然 ， 要 求 得 上 述 函 数 U( 半 ) 值 极 小 化 的 优化 解 ， 应 使 位 于 分 子 的 各 分 目标 也 
数 取 尽 可 能 小 的 值 ， 而 位 于 分 母 的 各 分 目标 画 数 取 尽 可 能 大 的 值 所 得 的 解 。 

















6.3 主要 目标 法 


主要 目标 法 的 基本 思想 是 根据 总 体 技术 条 件 ， 在 求 最 优 解 的 各 分 目标 吨 数 
帮 ( 下 )、 万 (下 ) 、…、fi( 半 ) 中选 定 其 中 一 个 作为 主要 目标 函数 ， 而 将 其 余 上 -1 个 
分 目标 函数 分 别 给 一 限制 值 后 ,使 其 转化 为 新 的 约束 条 件 。 这 样 抓 住 主要 目标 ， 同 
时 兼顾 其 他 目标 ， 从 而 构成 一 个 新 的 单 目标 最 优化 问题 进行 求 优 。 

例如 ， 一 个 具有 两 个 分 目标 函数 A ( 半 )， (站 ) 构 成 的 多 目标 优化 问题 ,其 
式 为 








V -min(f(X) p(X)) (6-13) 
st g(X)<00=1,2,.,m) 
假定 经 分 析 后 (站 ) 取 作 主要 目标 函数 ， p(X) 则 为 次 要 目标 函数 ， 把 次 要 目 
标 函 数 加 上 一 个 约束 #4”， 使 
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[AGE Sp (6-14) 
A” 为 一 事先 给 定 的 限制 值 (显然 它 不 能 小 于 (对 ) 的 最 小 值 )。 这 样 就 把 式 
(6-13) 表示 的 原 多 目标 最 优化 问题 转化 为 求 以 下 的 单 目 标 最 优化 问题 : 
了 一 minf (X) 
st g(X)<0 (=1,2,…,m) 
gm+1( 革 ) 9 -f/f(X) 三 0 
图 6-2 表明 g,( 下 ) =0(j =1,2,3,4) 构成 的 多 目标 优化 问题 的 可 行 域 。 
Xi? 、 于 分 别 为 minf( 生 ) 、minf;( 站 ) 的 最 优点 。 





(6-15) 





图 6-2 ”两 个 目标 函数 的 可 行 域 图 


现 将 (了) 转化 成 g; (和) =AY -() =0 的 新 的 约束 条 件 ， 这 样 原 多 目标 优 
化 问题 转变 为 f (下) 在 由 g,( 站 ) 二 0(j =1,2,3,4,5) 构 成 的 新 的 可 行 域 st 内 (阴影 
内 ) 的 单 目 标 优化 问题 。 显 然 X“ 是 原 多 目标 优化 问题 的 最 优点 。 

由 此 ， 也 可 把 任意 的 多 目标 优化 问题 转化 成 单 目 标 优化 问题 。 其 方法 归纳 
如 下 : 








minfi ( 半 ) 

XeRn 

st (X20 (f=1,2,.,m) 
0 


gnrp-1(X) = 万 -fh(X)20 (p=2,.…,L) 
式 中 ,fi( 半 ) 为 主要 目标 函数 。 


6.4 协调 曲线 法 


在 一 个 多 目标 优化 问题 中 ， 会 出 现 当 一 个 分 目标 函数 的 优化 时 将 导致 为 一 些 分 


(6-16) 
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目标 函数 的 劣化 ， 即 所 谓 目 标 函 数 相互 让 盾 的 情况 。 为 了 使 某 个 较 差 的 分 目标 也 达 
到 合理 值 ， 需 要 以 增加 其 他 几 个 分 目标 函数 值 为 代价 ， 也 就 是 说 各 分 目标 函数 值 之 
间 需 要 进行 协调 ， 互 相 做 出 一 些 让 步 ， 以 便 得 出 一 个 较 合理 的 方案 。 

这 种 矛盾 关系 可 以 通过 协调 曲线 法 来 形象 化 地 说 明 。 

以 无 约束 二 维 双 目标 水 数 A ( 竺 ) ,pp (站) 的 极 小 化 为 例 ， 图 6-3 给 出 了 各 上 自 的 等 
值 线 图 ， 可 以 看 到 它们 各 自 极 小 化 的 趋势 和 相互 关系 。 图 上 的 任意 一 点 代表 着 一 个 
有 具体 的 双 目 标 函 数 的 设计 方案 。 其 中 4、B 分 别 代表 fi (站 )、 (和) 的 极 小 值 点 。 

C 点 为 某 一 设计 方案 ,该 处 (站) =4， 
万 ( 导 ) =9 当 取 定时 , 极 小 化 (XX) 得 D 点 
(ACE) =1.5) 为 最 佳 设 计 方案 。 同 样 ， 当 取 
定 有 (站 ) =4 时 ， 极 小 化 户 ( 革 ) ， 可 得 到 下 操 
为 最 佳 计 方 案 。 显 然 D、E 两 点 的 设计 方案 
均 优 于 CC 点， 实际 上 在 阴影 区 内 的 任 一 设计 
方案 均 优 于 C 点 。 

线段 DE 的 延长 线 4B 即 协调 曲线 ,设计 
方案 点 在 该 线段 上 移动 ， 出 现 一 个 函数 值 减 
小 必然 导致 另 一 图 数值 增 大 、 两 目标 郴 数 相 
互让 盾 的 现象 。48 线段 形象 地 表达 了 两 目 
标 函 数 极 小 化 过 程 中 的 协调 关系 ， 其 上 任 一 图 63 一 维 双 目 标 函数 的 等 值 线 图 
点 都 可 实现 在 一 个 目标 函数 值 给 定时 ， 获 得 
男 一 目标 函数 的 相对 极 小 化 值 ， 该 值 即 可 用 作 确 定 x, 、x, 的 参考 。 

图 6-4 所 示 是 在 (下 ) -( 下 ) 坐 标 系 jx) 
内 用 图 6-348 线段 上 各 点 所 对 应 的 函数 值 
做 出 的 关系 曲线 ， 这 是 协调 曲线 的 另 一 种 
表现 形式 ， 在 这 里 可 以 更 清楚 地 看 出 两 目 10 
标 函 数 极 小 化 过 程 中 相互 矛盾 的 关系 。 

可 将 协调 曲线 作为 使 相互 刻 盾 的 目标 
也 数 取得 相对 优化 解 的 主要 依据 。 至 于 要 5 
从 协调 曲线 上 选 出 最 优 方案 ， 还 需 按 协调 
曲线 法 进行 多 目标 优化 设计 ， 比 较 适 用 于 
两 个 目标 函数 极 小 化 时 出 现 相互 矛盾 的 情 0 5 10 fi) 
形 ， 因 为 这 时 通过 画 出 协调 曲线 便 可 以 比 
较 透 彻 地 分 析 各 目标 与 设计 方案 的 依存 关 
系 ， 设 计 者 再 结合 两 个 目标 恰当 的 匹配 要 
求 、 实 验 数 据 、 其 他 目标 的 好 坏 以 及 设计 者 的 经 验 综 合 确 定 设 计 的 改进 方 同 ， 做 出 
比较 满意 的 设计 。 对 于 两 个 以 上 分 目标 函数 的 问题 ， 虽 然 仍 可 以 应 用 ， 但 协调 曲线 




































































图 6-4 4B 线段 上 各 点 ( 见 图 6-3) 
所 对 应 函数 的 协调 曲线 
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变 为 多 维 抽象 的 协调 曲面 ， 这 些 曲面 不 可 能 用 图 形 表示 出 来 ， 只 能 给 出 各 目标 函数 
值 的 变化 范围 ， 其 值 可 按 如 下 的 数学 模型 依次 求 得 ， 即 
min f(X) j=1,2,.…,g 
st. h,(X)=f(X) -ff v=1,2,.…,q9—1,v0#j 
2,(X)<O0 w=1,2,.…,m 
式 中 , 廊 " 为 目标 函数 六 (X) (v=1,2,…,g 一 1) 的 给 定 的 值 。 


6.5 分 层 序列 法 及 宽容 分 层 序 列 法 





分 层 序列 法 是 将 多 目标 优化 问题 式 (6-1) 中 的 工 个 目标 函数 分 清 主 次 ， 按 其 
重要 程度 逐一 排除 ， 然 后 依次 对 各 个 目标 函数 求 最 优 解 ， 而 后 一 目标 应 是 在 前 一 目 
标 最 优 解 的 集合 域 eD 内 寻 优 。 

现 假 设 / (于) 最 重要 ， (于) 其次，…。 则 先 对 第 一 个 目标 函数 (站 ) 求 解 ， 并 
得 最 优 值 








minfi (X) =f1(X ) (6-17) 
在 第 一 个 目标 函数 的 最 优 解 的 集合 域 卫 eD 内 ， 求 第 二 个 目标 函数 (对) 的 最 
优 值 时 ， 需 将 第 一 个 目标 孔 数 转化 为 辅助 约束 。 即 求 
minf,(X) = 万 (天 ) 
人 
然后 ， 再 在 第 一 、 第 二 个 目标 函数 的 最 优 解 的 集合 域内 ， 求 第 三 个 目标 孔 数 
广 () 的 最 优 值 (对 ") ， 此 时 ， 第 一 、 第 二 个 目标 函数 转化 为 辅助 约束 。 
即 





(6-18 ) 











sh =fs(X ) (6-19) 


XR EDEN XIN F(R “(Lal 2) 
以 此 类 推 , 最 后 求 第 上 个 目标 函数 (XX) 的 最 优 值 ， 即 
minf,(X) =fi(X ) (6-20) 
下 ED ,CIXIfA(X)</A(X)) (i=1,2,…,L-1) 
其 最 优 值 是 f; ( 半 ”) ， 对 应 的 最 优点 是 。 这 个 解 即 是 多 目标 优化 问题 式 
(6-1) 的 最 优 解 。 
采用 分 层 序列 法 ， 在 求解 过 程 中 也 可 能 出 现 中 断 现 象 ， 使 求解 过 程 无 法 继续 进 
行 下 去 。 例 如 ， 当 求解 到 第 个 目标 函数 的 最 优 解 是 唯一 时 ， 再 往 后 求 第 +1、 
5+2、…、 工 个 目标 函数 的 解 已 没有 意义 了 。 这 时 可 供 选 用 的 最 优 设计 方 案 并 没有 
考虑 第 有 个 以 后 的 目标 函数 。 尤 其 是 当 求 得 的 第 一 个 目标 函数 的 最 优 解 是 唯一 时 ， 
则 更 失去 了 多 目标 优化 的 意义 了 。 为 此 引入 宽容 分 层 序 列 法 ， 这 种 方法 就 是 对 各 日 
标 函 数 的 最 优 值 放宽 要 求 ， 先 对 各 日 标 函 数 的 最 优 值 取出 给 定 宽 容量 ， 即 得 e, >0， 
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;>0，…，ée, >0。 这 样 ， 在 求 后 一 个 目标 孔 数 的 最 优 值 时 ， 对 其 前 一 个 目标 函数 
不 青 严 格 限 制 在 最 优 解 内 ， 而 是 在 前 一 目标 清 数 最 优 值 附近 的 某 一 范围 进行 优化 ， 
因而 避免 了 计算 过 程 的 中 断 。 即 

1)minfi(X) =fi(X ) 

XeD 

2)minf(X) =f(X ) 

XeD CIXIf(X)</A(X)+e| 

3)minfs(X) =f(X ) (6-21) 

KeD,C{IXIf(X)</(X*)+e)} (i=1,2) 








4)minf,(X) =f,(X ) 
XeD,_ ,CIXIf(X)</(X )+e,| (2 LL) 

其 中 es, >0， 最 后 求 得 最 优 解 和 ”。 

以 上 介绍 了 几 种 多 目标 问题 的 优化 设计 方法 。 实 际 上 ， 在 工程 设计 中 ， 多 目标 
优化 设计 间 题 是 一 个 相当 普 裔 的 工程 设计 问题 ， 而 且 多 数 是 要 求 在 相互 矛盾 的 多 日 
标 中 找 出 其 最 优 解 。 由 于 我 们 很 难 预先 擎 握 各 个 分 目标 函数 的 变化 规律 ， 所 以 也 就 
难以 自动 地 选择 出 合理 的 权 因 子 值 。 因 此 ， 目 前 还 面临 着 不 少 问题 ， 如 : 从 工程 
设计 意义 上 讨论 多 目标 问题 最 优 设 计 解 的 定义 ; 凶 研 究 工 程 设 计 中 多 目标 问题 的 最 
有 效 而 且 简单 的 优化 设计 方法 和 工作 平台 ; (3 讨论 多 目标 问题 优化 设计 解 的 存在 
性 、 稳 健 性 和 对 偶 性 等 一 些 基本 理论 ; (9 研究 一 种 基于 知识 工程 的 多 目标 优化 决策 
系统 : 




















6.6 多 目标 项 数 优化 法 设计 实例 


例 6-1 试用 线性 组 合 统一 目标 函数 法 优化 秘 爪 式 装载 机 抓 取 机 构 。 图 6-5 表 
示 该 机 融 的 外 形 图 和 计算 简 图 。 这 个 工作 机 构 是 属 曲 柄 直线 导轨 机 构 ， 对 它 的 设计 
要 求 是 : 

1) 曲柄 直线 导轨 机 构 杂 点 的 轨迹 xy,yw) 与 给 定 的 轨迹 曲线 (xo,ywo) 的 
误差 达到 最 小 ， 即 


NI 


fi(X) = 2 LU — xo;)” 十 (yw ) -yo;) ] 一 min 


2) 抓 取 机 构 抓 不 的 位 置 角 w 与 给 定 的 位 置 角 av 的 误差 为 最 小 ， 即 
p(X) = 2 (ai - ao) 一 min 
3) 要 求 遇 柄 的 位 置 角 e 与 预期 轨迹 曲线 上 指定 点 相对 应 ， 即 当 曲柄 在 w 位 
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置 时 连 杆 点 pi 对 应 于 (zo ,Yo ) 点 ， 
> 位 置 时 对 应 于 人 人 印 
应 该 使 





fs(X) 三 2 (Agp;)” — min 
式 中 ,Ni 为 所 取 的 再 现 轨迹 点 数 ; N， 
为 所 取 的 再 现 位 置 角 点 数 ， 通 常 N, < 
NN ; Ag; 为 规定 的 曲柄 间隔 差 值 ，Agp, = 
Pi+1 一 io 

这 样 ， 统 一 目标 函数 可 按 如 下 方 
法 来 建立 : 
D(X) =Wf (XR) +Wf RR) + W(X)—mm 

由 于 三 个 目标 函数 均 为 误差 值 ， 
所 以 其 三 个 加 权 因 子 酚 、 了 配 和 了 瑟 值 
可 用 误差 容 限 法 。 取 a; =0，B; = 上 
(XW ) (j=1,2,3)， 其 加 权 因 子 值 取 
W =1/[(B,-o)/21 (=1,2,3)。 图 6-5 人 蟹 爪 式 装载 机 工作 机 构 优化 设计 示例 

例 6-2 试用 协调 曲线 法 优化 恒 载 作用 下 的 径 癌 动 压 滑动 轴承 。 如 图 6-6 所 示 ， 
设 玉 为 轴承 的 径 问 载 信 ，n 为 转速 ，e 为 轴承 间 陀 〈 其 值 近似 等 于 D, - DD) ,为 润 
滑 油 的 黏度 。 一 般 来 说 ， 动 压轴 承 的 工作 能 力 和 寿命 主要 取决 于 供 油 量 0 及 温 升 
Al。 供 油 量 钻 不足， 就 不 能 产生 油膜 ; 硅 有 足够 的 供 油 量 ， 一 方面 可 以 补充 轴承 泄 
漏 的 油 量 ， 男 外 还 可 以 通过 汤 出 的 油 带 走 一 部 分 热量 ,不致 发 生 过 热 现象 。 因 此 ， 
从 实际 意义 上 说 ， 应 取 两 个 设计 指标 ， 即 使 油膜 温 升 At 和 润滑 油 流量 0 达到 最 
小 。 设 计 变 量 取 着 = (L/D,c,m) ， 并 满足 0.25<LD<1, hs0.00127mm, pj 
9. 26MPa ,三 0. 006859Pa . s，At 志 150° 等 的 约束 条 件 。 





机 器 中 心 线 




















图 6-6 径 癌 动 斥 滑动 轴承 





这 是 一 个 三 维 的 两 个 目标 函数 的 优化 设计 问题 。 在 图 6-7 中 男 出 了 油 流 量 0 与 
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油膜 温 升 At 的 协调 曲线 ， 它 表示 了 满足 K-T 条 件 的 所 有 非 劣 解 。 为 了 从 中 选 出 
“ 选 好 解 ”， 可 以 先 作 出 当 不 同 温 升 At 时 的 各 主要 参数 的 变化 曲线 ， 如 图 6-8 所 示 。 
从 图 中 的 各 特性 曲线 可 以 看 出 ， 相 应 于 5 点 将 是 一 个 较 好 的 设计 方案 。 因 为 在 $ 点 
的 左边 ， 轴 和 承 间 际 很 快 增加 ， 当 间 际 过 大 时 ， 就 会 晃动 ， 运 动 不 稳 定 ， 使 在 工作 中 
产生 噪声 ; 若 在 $ 点 右边 ， 功 率 损失 和 油 的 黏度 增加 较 快 ， 这 是 不 好 的 。 在 $ 点 ， 
Ai =7.5% ， 所 以 选 好 解 应 为 广 (X) = At=7.5%C, 扩 (对 )=0=18cm.s ,设计 
点 为 四 =(0.3 ,0.0482 ,0. 006859) 7 











Q/ (cma3. s 1) 


0 10 10 20 30 30 100 130 
At 


图 6-7 动 压 滑动 轴承 润滑 油 流量 与 油膜 温 升 的 协调 曲线 


0 油 压 (MPa) 
2 
| 
140 | 


0.20 | 
功率 损耗 (kW) 
0.05 | 
TID ， 
1.24X1071 | 油膜 厚度 (mm) 
| 
| 
0.50 | 
0.25 WD 比值 


0.127 | 
间隙 (mm) 


0 
0.03425 | 
| 黏度 (P) 
| 


0.006859 
NS 25 35 30 100 130 


A1C 
图 6-8 ” 动 压 滑动 轴承 各 参数 的 特性 曲线 
注 : 1hp =745.700W, 1P=10-!Pa. s。 
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例 6-3 试用 功效 系数 法 建立 如 图 6-9 所 示 的 门 座 式 起 重 机 变 幅 四 杆 机 构 的 优 
化 设计 模型 。 
解 : 这 个 机 构 的 设计 希望 达到 如 下 儿 项 要 求 : 
(1) 在 四 杆 机 构 变 幅 行 程 中 ， 要 求 五 点 治水 平 直 线 ， 即 
fi(X)= 1maxl1y -天 | 一 >min 
(2) 在 四 杆 机 构 变 幅 行 程 中 ， 要 求 瑟 点 的 水 平分 速度 的 变化 最 小 ， 以 减 小 赁 
物 的 晃动 ， 即 





fF) = {maxlAv /Aali 一 min 
(3) 货物 对 支点 4 所 引起 的 倾覆 力矩 差 要 尽量 小 ， 即 
f(X) = 1maxlAMNI 一 min 
这 三 个 目标 函数 都 属 同类 性 质 ， 即 目标 函数 值 越 小 越 好 。 所 以 可 以 按 同 一 种 功 
效 系数 函数 来 定义 。 例 如 ， 对 于 轨迹 目标 函数 ， 可 参照 国际 最 先进 的 设计 水 平 ， 按 
照 设 计 要 求 先 定 出 最 坏 和 最 好 的 两 个 临界 值 ， 如 图 6-10 所 示 ， 若 1Ayl, <0. 1m， 
则 取 di =1; 若 1Ayliw >0.5m， 则 取 di =0; 然后 ,再 取 当 1Ayl =0.3m, di = 
0.7; 1Ayl =0.5m，di =0.3。 这 样 ， 把 各 点 间 用 直线 分 段 连接 起 来 ， 便 得 到 分 
段 的 线性 功效 系数 函数 d; =f( 1Ay1,) 。 同 样 道理 亦 可 以 定义 出 水 平 适度 变化 率 的 
功效 系数 函数 d, =f( 1Av,/Aal,, ) 和 倾覆 力矩 差 的 功效 系数 函数 ds =f( 1AM1,,)。 























d1=f(|Ay|max) 


qd3=/( [AM|max) 






和 


0 0.2 0.4 0.6 
[Aylmax/m 






1.3 2.5 3.3 4.5 


A Q=10t 
4d 








Avx 
-一 上 三 Smin=Om ACw max/ (m/s) 
et — 
25 35 45 55 
” 沙 





IAM|max/(t* m) 
图 6-9 ” 门 座 式 起 重 机 变 幅 四 杆 机 构 的 计算 简 图 图 6-10 ” 门 座 式 起 重 机 变 幅 四 杆 
机 构 优 化 设计 的 功效 系数 
(4) 在 变 幅 四 杆 机 构 的 设计 中 ,倾覆 力矩 值 是 一 项 很 重要 的 设计 指标 ， 而 
其 大 小 是 辟 染 摆 角 a 的 函数 ， 即 村 =M(a)。 从 理论 上 说 ， 整 个 变 幅 过 程 中 和 =0 
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为 其 最 理想 的 情形 ( 自 平 衡 机 构 ), 但 这 是 不 易 实现 的 。 因 此 ， 在 设计 时 希望 
做 到 : 

1) 在 变 幅 距离 较 小 时 ， 和 希望 作用 有 能 恢复 机 构 正 党 位 置 趋势 的 负 力 怎 ， 如 
图 6-11a 所 示 ， 即 Wi =M(a) 有 一 定 的 负 值 。 

2) 在 变 幅 距离 较 大 时 ,希望 作用 有 恢复 正常 位 置 趋势 的 正 力矩 ， 如 图 6-11b 
所 示 即 M, = M(a) 有 一 定 的 正 值 。 




















a) 





图 6-11 门 座 式 起 重 机 变 幅 四 杆 机 构 极 限 位 置 时 所 要 求 的 倾 履 力矩 


a) 最 小 变 幅 b) 最 大 变 幅 


根据 这 两 项 设计 指标 的 要 求 ， 可 按 图 6-12 
所 示 的 功效 系数 函数 来 定义 。 例 如 ， 对 于 力 
和 矩 Ml， 最 理想 的 情况 是 当 -10t.* mM, < 
0t* m 时 ， 其 功效 系数 值 取 ds = 1。 当 然 也 应 
该 允许 出 现 较 大 的 负 力 和 矩 或 一 个 不 很 大 的 正 
力矩 , 但 当 Mi < -30t*m 和 20t.:m<M 时 
都 定义 为 不 可 接受 的 方案 ， 即 取 ds =0。 对 于 
力矩 M, 也 按 类 似 的 方法 来 定义 功效 系数 d;。 
这 样 ， 就 可 得 di =f 作 MM ) 和 d=/( MM;) 的 功效 
系数 函数 。 

综 上 所 述 ， 起 重 机 四 杆 变 幅 机 构 优 化 设计 
的 模型 为 


5 1/5 
max (I14) (Xe R") -40 -30 -20-10 0 10 20 30 40 
Wa MI/(t.m) 


图 6-12 ”倾覆 力矩 的 功效 系数 





st g,(X)<O0 (w=1,2,.…,m) 
对 于 起 重量 10t、 工 作 高 度 为 14. 5m， 最 小 
变 幅 距离 6m、 最 大 变 幅 距离 27m 的 港口 起 重 机 其 计算 结果 列 于 表 6-1。 
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表 6-1 港口 起 重 机 优化 设计 的 各 项 技术 指标 





上 且 | ZER IE 三 j Ki 
此 能 指标 | 变 由 范围 | 落差 。 | 水 平 速度 波动 | 。 力 扯 着 | | 
型 m A max/ mM 7 ~ max Msx "Im 
机 AS/ y ( Avi/Aa) AM,,/(t. m) | i 
进口 样机 也 20 0. 260 2. 44 43 +16 _33 
优化 设计 方案 21 0. 247 2. 20 30 +10 -18 
最 理想 的 要 求 大 小 小 小 绝对 值 小 绝对 值 小 














QD 是 近年 从 国外 引进 的 同类 机 型 中 性 能 最 好 的 一 种 产品 (DB-10 型 ) 。 


从 表 中 所 列 的 各 项 性 能 指标 值 可 以 看 出 ， 优 化 设计 结果 不 仅 明 显 地 改善 了 产品 
的 技术 指标 的 设计 水 平 ， 而 且 也 赶 上 并 超过 了 国外 某 些 同 类 产品 的 性 能 指标 。 
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7.1 概述 





前 述 各 种 优化 设计 方法 神 是 将 设计 变量 作为 连续 变量 进行 求 优 ， 但 工程 问题 很 
多 情况 下 ,设计 变量 实际 上 不 是 连续 变化 的 。 例 如 ， 齿 轮 的 齿 煞 只 能 是 正 整 数 ， 是 
整 型 变量 ; 齿轮 的 模 数 应 按 标准 系列 取 用 ， 钢 丝 直 径 、 钢 板 厚 上 度 、 型 钢 的 型 号 也 虱 
应 符合 金属 材料 的 供应 规范 等 ， 属 于 这 样 的 一 些 必须 取 离 散 数值 的 设计 变量 均 称 为 
离散 变量 。 

离散 变量 优化 方法 是 指 专门 研究 变量 集合 中 的 某 些 或 全 部 变量 只 定义 在 离散 
值 域 上 的 一 种 数学 规划 方法 ， 具 体 有 凑 整 解法 、 网 格 法 、 随 机 格 点 搜索 法 、 离 此 
惩罚 函数 法 、 离 散 复 合 形 法 等 。 与 连续 变量 优化 方法 相 比 ， 它 们 更 具 自 号 的 特 
点 。 机 械 设计 中 标准 化 、 规 范 化 日 趋 增多 ， 离 散 变 量 优化 方法 显得 十 分 重要 ， 其 
在 理论 上 、 方 法 上 以 及 计算 机 程序 设计 上 均 已 取得 一 些 人 研究 成 果 。 本 章 将 阐述 离 
散 变 量 优化 的 一 些 基 本 概念 ， 概 略 介绍 凑 整 解法 和 网 格 法 ， 重 点 介绍 工程 实用 的 
离散 复合 形 法 。 


7.1.1 离散 设计 空间 和 离散 值 域 


















































点 的 集合 。 这 些 点 的 坐标 值 是 该 变量 可 取 的 > 
离散 值 ， 这 些 点 称 为 一 维 离散 设计 空间 的 离 
散 点 。 二 维 连续 设计 变量 的 设计 空间 是 代表 
该 两 个 变量 的 两 条 坐标 轴 形 成 的 平面 。 二 维 
离散 设计 空间 则 是 上 述 平面 上 的 茶 些 点 的 集 
合 ， 这 些 点 的 坐标 值 分 别 是 各 离散 变量 可 取 

的 离散 值 ， 这 些 点 称 为 二 维 离散 设计 空间 的 
离散 点 。 如 图 7-1 所 示 , 在 xi0x, 平面 上 形 0 
成 的 网 格 节 点 即 二 维 离散 设计 空间 的 离散 ” 图 7-1 二 维 离散 设计 空间 中 的 离散 点 
点 。 对 于 三 维 离散 变量 ， 过 每 个 变量 离散 值 

作 该 变量 坐标 轴 的 垂直 面 ， 这 些 平面 的 交点 的 集合 就 是 三 维 离散 设计 空间 ， 这 些 交 
扩 就 是 三 维 离散 设计 空间 中 的 离散 点 ， 如 图 72 所 示 。 
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图 7-2 ”三维 离 散 设计 空间 中 的 离散 点 


7.1.2 离散 最 优 解 
由 于 离散 设计 空间 的 不 连续 性 ， 离 散 变量 最 优点 与 连续 变量 最 优点 不 是 同一 概 
念 ， 必 须 重 新 定义 。 
1. 离散 单位 邻 域 
在 设计 空间 中 ， 离 散 点 站 的 单位 邻 域 UN() 是 指 如 下 式 定 义 的 集合 : 
Ix,—A,,x,,X,+A,,i=1,2,.…,p 
| ly 


XIx,—e,x,x, te,i=p+1l,p+2,.…,n 


条 








UNCX) -| 


图 7-3 所 示 为 二 维 设 计 空 间 中 离散 点 天 的 离散 单位 领域 ， 则 
UN(X) = |A,B,C,D,E,F,G,H,X| 
一 般 情 况 下 ， 设 离散 变量 的 维 数 为 p， 则 VX(X) 内 的 离散 点 总 数 为 N=37。 





Xl 


图 7-3 二 维 设计 空间 中 离散 点 的 离散 单位 邻 域 


2. 离散 坐标 邻 域 
在 设计 空间 中 离散 点 天 的 离散 坐标 邻 域 UC( 对 ) 是 指 以 人 点 为 原点 的 坐标 轴线 
和 离散 单位 邻 域 UVN(E) 的 交点 的 集合 。 在 图 7-3 中 ， 离 散 点 X 的 离散 坐标 邻 域 为 
VOCR ETD DC 
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一 般 在 p 维 离散 变量 情况 下 ， 离 散 坐标 邻 域 的 离散 点 总 数 为 Y=2p +1。 

3. 离散 局 部 最 优 解 

若 全 "eD， 对 所 有 XeUN(X*)D, 人 恒 有 f(X*)<f(X)， 则 称 和 "是 离散 局 
部 最 优点 。 

4. 拟 离散 局 部 最 优 解 

车 "eeD， 且 对 所 有 诸 e UC(X")D, 恒 有 f(X”) <f(X)， 则 称 X" 是 拟 离散 
局 部 最 优点 。 

5. 离散 全 域 最 优 解 

若 全 '“ eD， 且 对 所 有 于 eD, 恒 有 f(X'“) <f(X)， 则 称 科 “为 离散 全 域 最 
优点 。 

严格 说 来 ， 离 散 优 化 问题 的 最 优 解 是 针对 离散 全 域 最 优点 而 言 ， 但 它 与 一 般 的 
非 线 性 优化 问题 一 样 ， 离 散 优 化 方法 所 求 得 的 最 优点 一 般 是 局 部 最 优点 ， 这 样 通常 
所 说 的 最 优 解 均 指 局 部 最 优 解 。 

由 于 设计 空间 的 离散 性 ， 离 散 最 优点 将 不 是 唯一 的 。 为 了 判断 站 点 是 否 是 最 
优点 ,应 将 UN() 内 所 有 离散 点 进行 比较 ， 得 到 局 部 最 优点 。 但 由 于 在 
UN() 中 离散 点 的 总 数目 W =3"， 若 维 数 p 很 大 ， 则 判断 离散 局 部 最 优点 下 一 的 计 
算 工作 量 太 大 ， 故 也 可 仅 在 UC(X) 中 进行 比较 ，UC( 站 ) 的 离散 点 总 数 仅 有 2p + 1 
个 ， 计 算 工 作 量 相对 来 说 少 一 些 。 但 这 样 判断 得 到 的 是 拟 离散 局 部 最 优点 X* ， 它 
可 能 是 离散 局 部 最 优点 ， 也 可 能 不 是 ， 因 而 以 此 作为 离散 最 优点 ， 其 可 靠 程度 会 低 


一 些 。 






































7.2 凑 整 解法 与 网 格 法 





该 法 的 特点 是 先 按 连续 变量 方法 求 得 优化 解 区 ， 然 后 再 进一步 找 整 型 量 或 离 
散 量 优化 解 ， 这 一 过 程 称 为 整 型 化 或 离散 化 。 下 面 介 绍 按 连 续 实 型 量 优化 得 到 优化 
解 后 如 何 圆 整 化 、 离 散 化 的 方法 ， 并 讲述 其 中 可 能 产生 的 问题 。 

设 有 nn 维 优 化 问题 ， 其 实 型 量 最 优点 为 X”e R"， 它 的 n 个 实 型 分 量 为 x;i (i = 
1,2,…,n) ， 则 xz 的 整数 部 分 ( 它 的 偏 下 一 个 标准 量 ) [xi ] 和 整数 部 分 加 1 即 
Lxi ]+1 《或 它 的 俩 上 一 个 标准 量 ) 便 是 最 接近 x; 的 两 个 整 型 (或 离散 型 ) 分 量 。 
由 这 些 整 型 分 量 的 不 同 组 合 ， 便 构成 了 最 邻近 于 实 型 最 优点 天” 的 两 个 整 型 分 量 
相应 的 一 组 整 型 点 群 [Xi ] =1,2,…,2，n 为 变量 维 数 ) 。 该 整 型 点 群 包含 有 2 7 
个 设计 点 ， 在 整 型 点 群 中 ， 可 能 有 些 点 不 在 可 行 域内 ， 应 将 它们 剔除 。 在 其 余 可 行 
域内 的 大 干 整 型 点 中 选取 一 个 目标 函数 值 最 小 的 点 作为 最 优 的 整 型 点 给 予 输出 。 
图 7-4 所 示 是 二 维 的 例子 。 在 实 型 量 最 优点 "周围 的 整 型 点 群 有 4、B、C、D 四 
点 ， 图 中 B 点 在 域外 ,A4、D、C 三 点 为 在 域内 的 整 型 点 群 ， 分 别 计算 其 日 标 隙 数 。 
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由 图 中 等 值 线 可 看 出 ， 其 最 优 整 型 点 是 C 点 ， 它 即 为 最 优 整 型 设计 点 [X*]。 但 
这 样 做 有 时 不 一 定 行 得 通 ， 因 为 连续 变量 的 最 优点 通常 处 于 约束 边界 上 ， 在 连续 变 
量 最 优点 附近 姿 整 所 得 的 设计 点 有 可 能 均 不 在 可 行 域内 ， 如 图 7-5 所 示 。 显 然 , 在 
这 种 情况 下 ， 采 用 连续 变量 优化 点 附近 次 整 法 就 可 能 得 不 到 一 个 可 行 设 计 方 案 。 羽 
一 方面 ， 这 种 简单 的 姿 整 法 是 基于 一 种 假设 ， 即 假设 离散 变量 的 最 优点 是 在 连续 变 
量 最 优点 附近 。 然 而 ， 这 种 假设 并 非 总 能 成 立 。 如 图 7-6 所 示 ， 按 上 述 假设 ， 在 连 
续 变 量 最 优 点 于 ”附近 凑 整 得 到 @ 点 ， 该 点 虽 是 可 行 点 ， 但 并 非 离散 变量 的 最 优 
点 。 从 岁 中 可 见 ， 该 问题 离散 变量 最 优点 应 是 离 导 较 远 的 已 点 ， 而 且 目 标 冰 效 与 
约束 函数 的 非 线 性 越 普 重 ， 这 种 情况 越 易 出 现 。 这 些 情况 表明 ， 竣 整 法 虽然 简便 ， 
但 不 一 定 能 得 到 理想 的 结 






































[x Ix]+1 4 


图 7-4 XX "周围 的 整 型 点 群 











硬 国 着 是 站 


图 7-5 周围 的 整 型 点 群 均 不 在 可 行 域内 图 7-6 离 X" 较 远 处 整 型 点 P 为 优化 点 的 情形 

由 上 述 分 析 可 知 ， 离 散 优 化 点 不 一 定 落 在 某 个 约束 面 上 ， 因 此 对 连续 变量 约束 
最 优 解 的 K-T 条 件 不 青 成 立 。 与 连续 变量 优化 解 一 样 ， 离 散 变 量 优化 解 通常 也 是 
指 局 部 优化 解 。 我 们 给 出 局 部 离散 优化 解 的 定义 ， 是 指 在 此 点 单位 邻 域 QUV(XK) 内 
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查 点 未 搜索 到 优 于 半点 的 离散 点 ， 所 得 的 解 即 为 局 部 离散 优化 解 半 "。 当 日 标 函 
数 为 是 函数， 约束 集合 为 凸 集 时 ， 此 点 也 是 全 域 的 约束 离散 优化 解 。 


7.3 离散 复合 形 ; 


离散 复合 形 法 是 在 求解 连续 变量 复合 形 法 的 基础 上 进行 改造 ， 使 之 能 在 离散 空 
间 中 和 直接 搜索 离散 点 ， 从 而 满足 求解 离散 变量 优化 问题 的 需要 。 它 的 基本 原理 与 第 
6 章 介 绍 的 连续 变量 复合 形 法 大 致 相同 ， 即 通过 对 初始 复合 形 调 优 迭代 ， 使 新 的 复 
合 形 不 断 向 最 优点 移动 和 收缩 ， 直 至 满足 一 定 的 终止 条 件 为 止 。 但 离散 复合 形 法 的 
复合 形 顶 点 必须 是 可 行 的 离散 点 ， 这 就 使 其 在 初始 复合 形 的 产生 、 约 束 条 件 的 处 
理 、 离 散 一 维 搜索 、 终 止 准则 以 及 重 构 复 合 形 等 方面 具有 与 连续 变量 复合 形 法 不 同 
的 特点 。 以 下 就 这 几 方 面 加 以 介绍 。 


7.3.1 初始 离散 复合 形 的 产生 


用 复合 形 法 在 n 维 离 散 设 计 空间 搜索 时 ， 通常 取 初 始 离 散 复 合 形 的 顶点 数 为 
k=2n+1 个 。 先 给 定 一 个 初始 离散 点 X”，X'” 必 须 满足 各 离散 变量 值 的 边界 条 
件 ;- 训 式 : (7 了 2 请 布 





























x SX Sx (i=1,2,.…,n) (7-2 ) 

式 中 ，x; 、%; 分 别 为 第 i 个 变量 的 下 限 值 和 上 限 值 。 
然后 按 下 列 公式 产生 初始 复合 形 的 各 个 项 点 : 

X0) =x (7=1,2,.,n) 2 

i 1 


=x’ (i=1,2,.…,n) 








XS) 


国 
He 
光 剖 加 省 带 回国 痢 澡 
加 略 加 回国 量 是 EE 


1 = 和 0) (i S12 na 


We =x’ (i =],2,.…,n) 


XO XY 
G32 

这 样 有 2n 个 顶点 分 布 于 nn 个 设计 变量 的 

mR 2 

上 、 下 限 约束 边界 上 。 图 7-7 表示 二 维 问题 中 


按 式 (7-3) 产生 的 离散 复合 形 的 五 个 初始 顶 
点 四 (0 、 四 2) 、 四 9) 、 下 4 、 居 5) 的 分 布 情况 。 图 77 为 5 个 初始 复合 形 项 点 的 分 布 


7.3.2 约束 条 件 的 处 理 

由 于 上 述 初始 复合 形 顶 点 的 产生 未 考虑 约束 条 件 ， 此 时 产生 的 初始 复合 形 顶 点 
可 能 会 有 部 分 甚至 全 部 落 在 可 行 域 D 的 外 面 。 在 调 优 迭 代 运 算 中 必须 保持 复合 形 
各 顶点 的 可 行 性 ， 故 如 果 有 部 分 顶点 落 在 可 行 域外 面 ， 可 采用 下 述 方法 将 其 移入 可 
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行 域 之 内 。 | 
定义 离散 复合 形 的 有 效 目 标 函 数 /( 闷 ) 如 下 : 
f(xX) XeD 
J 入 + Bal(X) X¢ED (0 


式 中 , /(X) 为 原 目标 函数 ，M 为 一 个 比 /() 值 数量 级 大 得 多 的 常数 ; e = |jlg,( 站 ) 
<0(j=1,2,…,m)}。 图 7-8 所 示 为 一 维 变量 时 由 式 (7-4) 定义 的 有 效 目 标 函 数 
f(x) 的 示意 图 。 由 图 可 见 ， 在 可 行 域 D 以 外 , /() 的 曲线 像 一 个 向 可 行 域 D 倾斜 
的 “漏斗 "， 当 部 分 复合 形 项 点 在 可 行 域 之 外 时 ， 最 坏 的 顶点 X” 一 定位 于 可 行 域 之 
外 的 一 个 离散 点 上 。 以 此 点 为 进行 离散 一 维 搜索 的 基点 ，M 在 有 效 目标 函数 成 蕊 ) 
= M - 了 gj(X) 中 保持 不 变 , 而 - g,(X) 的 值 则 随 搜索 点 离 约束 面 的 位 置 而 变 


化 。 离 约束 面 越 近 ， 其 值 越 小 ; 反之 ， 其 值 越 大 。 jo 
这 样 从 不 可 行 离散 顶点 出 发 的 离散 一 维 搜索 实际 上 
是 求 - 于 g(X) 的 极 小 值 , 当 - gj(X) = 0， 


即 进 入 可 行 域 D， 从 这 时 起 目标 函数 / (X) =/ 
(对 ) ， 由 于 可 行 域 D 的 边界 好 像 由 MM 筑 起 的 一 墙 
“高 墙 "， 从 而 保证 始终 在 可 行 域 内 继续 搜索 /(X) 

的 极 小 值 。 按 这 种 处 理 方法 设计 的 程序 可 自动 地 将 

先 由 不 可 行 离散 点 寻找 可 行 离散 点 和 接 下 来 的 从 可 ? 
行 离散 点 寻找 离散 最 优点 这 两 个 阶段 的 运算 过 程 很 图 7-8 ”有效 目标 函数 图 
好 地 统一 起 来 。 


7.3.3 离散 一 维 搜索 


离散 复合 形 的 迭代 调 优 过 程 与 一 般 复 合 形 类 似 ， 即 以 复合 形 项 点 中 的 最 坏 点 
Xi 为 基点 ， 把 Xi 和 其 余 各 顶点 的 几何 中 心 点 的 连 线 方向 作为 搜索 方向 S$， 采用 
映射 、 延 伸 或 收缩 的 方法 进行 一 维 搜索 ， 待 找到 好 点 XX ， 则 以 该 点 代 兰 最 坏 点 组 
成 新 的 复合 形 ， 重 复 以 上 步骤 迭代 调 优 。 

设 为 维 数 ,p 为 离散 变量 个 数 ， 为 保证 离散 一 维 搜索 得 到 的 新 点 叶 为 一 离 癌 
点 ， 其 各 分 量 值 应 为 


















































0 
| (735) 


x =x) (i=1,2,…,p<n) 
式 中 ，5, 为 离散 一 维 搜索 方向 S =Xc -&a 的 各 分 量 ， 即 

S =Xr —x, (i=1,2,.…,n) (7-6) 
a 为 离散 一 维 搜索 的 步 长 因子 ; 《xi; 表示 取 最 靠近 xi 的 离散 值 g; 。 离 散 一 维 搜 索 
可 采用 简单 的 进退 对 分 法 ， 其 步骤 可 参阅 图 7-9。 
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c(U)=2 c(D)=1 





xH XR 


图 7-9 离散 一 维 搜索 的 进退 对 分 法 


1) 一 般 取 初 始 步 长 a =1.3， 置 w ”一 a 一 ac ，1 于 

2) 按 式 (7-5) 求 新 点 夭 k。 

3) 如 XE 比 台 好 ， 则 进行 第 4) 步 ， 否则 ， 置 0=k， 转 第 4) 步 。 

4) 如 =1， 则 2a? 坟 a ，a +a 坟 a， 返 回 第 2) 步 ; 否则 ， 置 0. Sa 一 
，Qa' -Qa=>a 返回 第 2) 步 。 

5) 当 w … < oi, 时 ， 离 散 一 维 搜索 终止 ，a, 称 为 最 小 有 用 步 长 因子 ， 其 值 按 
式 (7-7) 求 出 : 


a 





0.5 
S. 


L 


Ci 


9 


L 

















Qin = min| 
i=1,2,,p 


| 全 
式 中 ，e; 是 连续 变量 的 拟 离散 增 量 。 
还 需 指 出 ， 以 上 由 罗 点 沿 5 方 同 进 行 一 维 离散 搜索 ， 由 于 设计 空间 的 离散 后 
远 远 少 于 连续 点 ， 有 可 能 沿 基 4/ 和. 连 线 方 同 找 不 到 一 个 比 和 更 好 的 点 ， 这 时 需要 
改变 一 维 离 散 搜 索 方 辐 ， 而 依次 改 用 第 2 坏 点 ， 第 3 坏 点 ， 和 直至 第 -1 个 坏 点 和 
复合 形 中 点 于 的 连 线 方 问 作为 搜索 方 回 重新 进行 一 维 搜索 。 如 采 依 次 进行 了 上 述 
及 -1 个 方 辐 搜 索 后 ， 仍 找 不 到 一 个 好 于 和 的 点 ， 则 将 离散 复合 形 各 顶点 均 癌 最 
好 顶点 和 下方 回 收缩 1/3， 构 成 新 的 复合 形 再 进行 一 维 搜索 。 
7.3.4 ”离散 复合 形 算法 的 终止 准则 
当 离 散 复 合 形 所 有 顶点 在 各 坐标 轴 方 喇 上 的 最 大 距离 d; 不 大 于 相应 设计 变量 x 
的 离散 值 增 量 A，( 对 连续 变量 为 拟 离散 增 量 e,) 时 ， 表 明 离 散 复 合 形 各 顶点 的 坐标 
值 已 不 再 可 能 产生 有 意义 的 变化 ，d,; 按 式 (7-8) 计算 : 
ds =0 = {i=1,2 nm) (7-8) 
a, =min|x® (k=1,2,.…,2n+1)) 
b,=max{x (k=1,2,.…,2n+1))| 
如 采 在 nn 个 坐标 轴 方 喇 中 ,满足 d; 二 A， (或 e;) 关系 的 方 癌 数 大 于 一 个 预先 给 
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定 的 分 量 数 EN， 则 可 认为 收敛 ， 离散 复合 形 闪 代 运算 即 可 终止 。EN 取 | 了 ~ | 间 
的 正 整 数 。 
7.3.5 重 构 复 合 形 


收敛 条 件 所 求 得 的 复合 形 最 好 顶点 ， 筷 仅 是 A〈 或 e) 范围 内 的 最 好 点 。 妃 . 
并 不 能 保证 是 单位 邻 域 UN(X) 内 的 最 好 点 ， 由 图 7-3 可 知 ， 单 位 邻 域 的 坐标 尺寸 
范围 是 两 倍 的 A，( 或 a;) ， 因 而 将 这 种 情况 下 的 外 点 作为 最 优点 是 不 可 徘 的。 为 了 
避免 漏 掉 最 优点 ， 我 们 再 采取 多 次 构造 离散 复合 形 进 行 运算 ， 和 直到 前 后 两 次 离散 复 
合 形 运算 的 最 好 点 重合 为 止 。 具 体 做 法 是 以 前 一 次 满足 终止 条 件 得 到 的 最 好 点 1 
作为 初始 点 XX'”， 重 新 构造 初始 复合 形 进行 兴 代 调 优 计算 ,如果 下 一 次 满足 收敛 条 
件 得 到 的 好 点 Xi 与 X” 重 合 ， 即 认为 已 求 得 最 优 解 X" ， 否 则 还 应 再 次 构造 初始 复 
合 形 继续 运算 。 
7.3.6 离散 复合 形 法 的 迭代 过 程 及 算法 框图 

离散 复合 形 的 迭代 计算 过 程 如 下 : 

1) 选择 并 输入 运算 的 基本 参数 : 维 数 n， 离 散 变 量 个 数 p， 各 设计 变量 的 上 、 
下 限 x; 和 x; ， 离 散 变 量 的 离散 值 增 量 A,; (i =1,2,…,p)， 连 续 变 量 的 拟 离散 增 量 
ei(i=p+1,p+2,…,n)， 判 别 收 敛 的 分 量 数 EN。 

2) 选取 一 个 满足 设计 变量 上 、 下 限 的 离散 初始 点 '”。 



































3) 由 了 个 按 式 (7-3) 产生 有 =2n +1 个 复合 形 顶 点 。 
4) 计算 各 顶点 的 有 歼 目 标 呆 数值 。 
5) 各 顶点 按 有 效 目 标 函 数值 的 大 小 进行 排队 ， 找 出 最 好 点 、 最 坏 点 筷 ，。 








6) 检查 复合 形 终 止 条 件 ， 若 已 满足 则 转 第 13) 步 ; 否则 进行 下 一 步 。 

7) 求 除 最 坏 点 外 的 顶点 几何 中 心 站 .， 以 科 . 为 基点 ， 沿 站 -方向 进行 一 
维 离散 搜索 。 

8) 若 一 维 离散 搜索 终点 的 有 效 目 标 函 数值 比 允 点 函数 值 小 ， 则 一 维 离散 搜索 
成 功 ， 转 第 9) 步 ; 否则 转 第 10) 步 。 

9) 用 一 维 离散 搜索 终点 代替 外 点， 完成 一 轮 迭 代 ， 转 入 第 5) 步 。 

10) 改变 搜索 方向 ， 即 以 下 一 个 坏 点 为 基点 ， 沿 该 点 与 和 X. 的 连 线 方向 进行 一 
维 离散 搜索 。 

11) 如 搜索 成 功 ， 转 第 9) 步 ; 否则 进行 下 一 步 。 

12) 若 改变 搜索 方向 未 到 和 22 次， 则 返回 第 10) 步 ， 否 则 各 顶点 向 最 好 点 收缩 
1/3， 转 第 4) 步 。 

13) 检查 点 是 否 与 X¥” 点 重合 ， 若 不 重合 ， 则 置 X¥ ,二 XY'"”， 转 第 3) 步 ; 若 
重合 ， 则 输出 结果 了 . 壤 半 ”，f( 站.) 之 所 和 ) ， 结 束 迭 代 。 
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离散 复合 形 法 的 算法 框图 如 图 7-10 所 示 。 
为 进一步 提高 离散 复合 形 法 的 效能 ， 计 算 程序 还 可 以 按 需 要 配 以 二 次 轨 线 加 速 





搜索 、 贴 边 搜索 、 最 终 反 射 技术 等 辅助 功能 。 


给 定 : n, p, x 他 xf,Aj, 2，PENO=1，2，…， 门 





选 定 初始 点 X(0) 
由 X( 产 生 2n+1 个 复合 形 顶 点 









按 有 效 目 标 函 数值 大 小 将 各 顶点 排队 
找 出 最 好 点 入 、 最 坏 点 XH 


满足 终止 条 件 ? 


求 除 XH 外 各 顶点 的 几何 中 心 Xc， 
以 XC 为 基点 ， 沿 XC-XH 方 向 进 
行 一 维 离散 搜索 


以 搜索 终点 
搜索 成 功 ? 输出: 二 XX 
代替 Xi CD 


以 下 一 个 坏 点 为 基点 改变 


方向 进行 一 维 离散 搜索 
搜索 成 功 ? 


搜索 方向 已 
改变 2n 次 ? 









各 顶点 向 成. 
点 收缩 1/3 


图 7-10 ”离散 复合 形 法 的 算法 框图 


7.4 离散 变量 的 优化 设计 实例 


例题 ”如 图 7-11 所 示 ， 设 有 一 箱 形 盖 板 ， 已 知 长 度 0 =600cm， 宽 度 0 = 
60cm， 厚 度 太 =0.Scm。 恤 板 厚 度 为 ycm， 它 承受 最 大 的 单位 载荷 9 =0.01MPa， 要 
求 在 满足 强度 、 刚 度 和 稳定 性 等 条 件 下 ， 设 计 一 个 重量 最 轻 的 结构 方案 。 

解 : (1) 设计 分 析 
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A 9g=0.01MPa 5 
FA 
0 人 
~ 
二 NS a 
4| tf.—0.S5em 


图 7-11 箱 形 六 板 尺寸 图 


设 箱 形 盖 板 为 铝 合 金 制 成 ， 其 弹性 模 量 已 =7 x10 MPa， 泊 松 比 =0.3， 人 允许 
这 时 应 力 [oj] =70MPa， 人 允许 切 应 力 r=45MPa。 经 过 力学 分 析 ， 得 出 如 下 公式 及 
数据 。 











截面 的 惯性 窍 近 似 取 
这 bh? -301 大 
最 大 切 应 力 为 
0 18000 
mx Ih hh 
最 大 人 要 曲 应 力 〈 荔 板 中 间 ) 为 
Mh 450 
C3 
式 中 ，0Q 为 最 大 剪 力 ，QO = 18000N。 
各 板 中 的 屈曲 临界 稳定 应 力 为 
2F 类 2 
| 1 x4 二 70 


最 大 搁 度 为 
六 -5 qilo 56.2 x104 
384E1 Eh 
盖 板 单位 长 度 的 质量 (kg/cem) 为 
W=p(120t, +h) 
式 中 , p 为 材料 的 密度 ， 单 位 为 Vem 。 
(2) 数学 模型 
根据 设计 要 求 ， 建 立 如 下 数学 模型 : 


设计 变量 为 





lo (gq1 =q x6b) 


目标 负数 为 
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f(X) =120x, +x, 
式 中 已 略 去 密度 p， 因 为 它 对 目标 函数 极 小 化 没有 影 啊 。 
设计 约束 : 按照 强度 、 刚 度 和 稳定 性 要 求 建立 如 下 约束 条 件 : 





81 (下 ) =2X1 >0 
282 (下 ) 二 XX >0 
g3(¥) =[7]/7, -1=0.25x, -1=0 


ga(X) [Casa = -1=0 





max 


gs(X)=[o.)/o,, -1 = -1 三 0 


- 1 
ge(X)=[fI/f -1 = 41 -1=0 


单位 长 度 允 许 找 度 取 [fj/l =1/400。 
在 图 7-12 中 给 出 了 这 个 问题 在 设计 平面 上 的 几何 关系 : fA 站 ) 的 等 值 线 和 约束 
边界 曲线 g, (于) ~ ge (着) 。 了 表 影 线 的 右边 为 可 行 设计 区 域 ， 其 最 优 解 在 P 操 。 








X2/cm 







( 


24.9685 
fCX )=101.3605 
BX , r=101.3706 


图 7-12 箱 形 新 板 优 化 设计 空间 关系 


(3) 求解 方法 和 绪 
用 内 点 惩罚 函数 法 来 解 这 个 问题 。 其 惩罚 也 数 如 下 式 : 
CS (1 1 
D(X,r ) =f/(X) +r > z(¥) 
初始 点 取 半 ”= (1,30) ， 是 一 个 可 行 点 。 取 惩罚 函数 因子 初始 值 ""” =3， 缩 
减 系数 c=0.7， 收 敛 精度 e =10“， 用 鲍威尔 方法 求 函 数 B( 站 ,rr'” ) 的 无 约束 优化 
极 值 ， 其 计算 结果 见 表 7-1。 
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表 7-1 用 内 点 惩罚 函数 法 求解 盖 板 问题 。 (x = 六 xs =h 单 位 : cm) 





























下 下 
六 PDK” ,rt ) r(® D(X* ,7®) 
Xl x Xl x 
3 1. 0000 30. 0000 | 157.5689 ||0.488 x10-? | 0.6345 25. 5097 102. 0364 
2.1 0. 6519 33.3545 | 127.1697 
1.47 0. 6460 32. 1997 | 122.1886 ||0.231x10-4 | 0.6366 24. 9685 101. 3803 
1. 029 0. 6391 30.2894 | 115. 0050 
0. 7203 0. 6373 29.5106 | 112.4360 || 0.45 x10-5 0. 6366 24. 9685 101. 3709 
0. 6042 0. 6361 28. 8327 | 110. 3670 
0. 133 x10 -9” | 0.6366 24. 9685 101. 3706 
0. 1729 0. 6348 27. 3077 | 106. 2512 
0.17 x10 0. 6366 24. 9685 101. 3706 
0. 0415 0. 6349 26.1520 | 103. 5664 |‖0.6827 x10 -2 | 0.6366 24. 9685 101. 3706 





共 循 环 大 =71 次 ,> 值 由 3 降 至 0.6827 x10-“， 壕 代 129 次 ， 其 最 优 解 为 好 
=0. 6366，x*” =24.9685，F(X* ) =101.3605，G(X ,ro ) =101.3706， 由 于 > 值 
几乎 趋 近 于 零 ， 所 以 说 明 取 得 了 较 精 确 的 解答 。 

在 图 7-13 中 给 出 了 三 个 > 值 分 别 为 2.1，1.47 和 0.488 x10 “的 惩罚 函数 
D(X* ,r” ) 等 值 线 的 图 形 ， 表 明了 条 件 极 小 点 逐渐 向 真正 最 优点 靠拢 。 





r=1.47 约束 面 、| r=0.488 X10™ 


AN 100 SN 
X(t) ( 40.6460) i 


\ \ XO)= 0.6345 
60 ) | 










一 32.1997 
*, (A / 0.6519 
Ge 本 | 





和 
a) b) ¢) 


图 7-13 用 内 点 惩 避 函数 法 求解 箱 形 盖 板 问题 的 空间 关系 








接 下 来 用 离散 变量 法 优化 此 问题 。 硅 取 设计 变量 的 离 获 值 为 
xi =t; =0. 0cm,0. lecm,0. 2em,0. 3cm,*… 
xy =h =15.0cm,25. 0cm ,40. 0cm ,60. 0cm ,… 
该 问题 为 全 离散 问题 ， 其 数学 模型 为 
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minf(X” ) =120x7 +x> 

s.t eg (KX)=x? >0 
g (KR )=x? >0 
ga(¥" ) =0.25x? -1=0 


gu(X") =157 0 -1>0 


7 
gs(X") =Ai(w) ey -1>0 


Be 

gs\X ) =351.4 
I 

下 面 分 别 用 离散 随机 搜索 法 、 离 首 





x? (x7) -1=0 




















变量 组 合 形 法 和 离散 惩罚 孔 数 法 进行 计 0 a Da eo We lO 
算 ， 并 取得 相同 的 离散 最 优 解 : x? = 图 7-14” 按 离散 变量 设计 箱 形 
0.7, x2 =25.0， 表 7-2 列 出 了 计算 的 有 盖 板 的 设计 空间 关系 
关 数 据 ， 图 7-14 表示 了 按 离散 变量 设计 
的 设计 空间 关系 。 
表 7-2 三 种 离散 优化 方法 的 计算 结果 
初 始 点 离散 最 优 解 目标 函数 | 约束 函数 
x | 9 | wr | TAX 计算 次 数 计 算 次 数 ee 
离散 随机 搜索 法 | 0.7 40 0.7 | 25.0 |109.00| 52 和 
离散 变量 组 合 形 法 | 0.7 40 0.7 | 25.0 1109.00| 21 30 一 维 搜索 用 前 进 后 退 法 
无 约束 极 小 化 调 
离散 惩罚 函数 法 | 0.7 | 40 | 07 | 25.0 |109.00| 382 260 ， ， 。 人 


























由 表 7-2 可 以 看 出 ， 虽 然 三 种 方法 都 能 取得 相同 的 计算 结果 ， 但 其 计算 效率 却 











显著 不 同 。 最 后 还 应 该 说 明 ， 日 前 现 有 的 离散 优化 方法 还 不 能 说 是 十 分 完善 的 ， 
为 它们 的 解 题 能 力 与 计算 效率 都 与 数学 模型 的 性 态 有 很 大 关系 。 因 此 ， 进 一 步 研 究 
通用 性 强 、 可 靠 和 高 效 的 约束 非 线性 离散 变量 优化 设计 方法 ,不 仪 具有 重要 的 理论 
价值 ， 而 且 也 具有 非常 重要 的 工程 实际 意义 。 
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8.1 概述 











许多 工程 实际 问题 的 设计 往往 含有 大 量 的 不 确定 因素 ， 尤 其 是 结构 设计 中 约束 
的 容许 范围 和 失效 准则 具有 一 定 的 模糊 性 ， 例 如 在 轴 的 设计 中 ， 其 承载 的 力 越 大 ， 
截面 积 应 越 大 ， 即 应 力 约束 的 形式 可 表达 为 fF/4<[o]， 这 里 ， 如 果 设 计 超 出 了 
[oj ， 传 统 的 设计 方案 就 认为 是 绝对 不 安全 的 ， 而 实际 上 应 力 有 一 个 从 容许 到 完全 
不 容许 的 过 渡 阶 段 ， 在 一 定 范围 内 即使 超出 了 [oj], 仍然 可 认为 是 可 用 的 ， 而 且 
往往 存在 最 优 解 。 

机 械 设计 中 也 存在 大 量 模 糊 的 信息 ， 如 在 对 结构 优化 设计 时 ， 通常 要 考虑 一 项 
或 几 项 指标 ， 如 质量 、 造 价 、 刚 度 、 固 有 频率 等 作为 设计 目标 ; 根据 材料 的 强度 、 
刚度 性 质 和 结构 的 使 用 要 求 ， 需 要 设计 约束 允许 范围 和 失效 准则 的 模糊 性 ， 以 及 结 
构 在 工作 期 间 所 受 的 载 信 的 模糊 性 和 连接 的 边界 条 件 的 模糊 性 等 。 

模糊 优化 设计 就 是 指 在 优化 设计 中 考虑 种 种 模糊 因素 ， 在 模糊 数学 基础 上 发 展 
起 来 的 一 种 新 的 优化 理论 和 方法 。 本 草 首 先 介绍 模糊 集合 的 基本 概念 ， 然 后 介绍 几 
种 模糊 优化 设计 方法 。 


8.2 单 目标 模糊 优化 设计 

















8.2.1 模糊 集 
1. 模糊 集 的 定义 
给 定论 域 U 上 的 一 个 模糊 集 4 是 指 : 对 任何 weU， 都 指定 了 一 个 数 wy (z) e 


10,1] 与 之 对 应 ， 它 叫 作对 4 的 素 属 度 ， 这 意味 着 做 出 了 一 个 映射 ， 妈 
Ai :U0,1], pp % (1) (8-1) 
这 个 映射 称 为 4 的 隶属 函数 ， 其 中 的 波浪 号 表示 变量 或 运算 中 含有 模糊 信息 ， 
如 图 8-1 所 示 。 
模糊 集 完全 由 隶属 函数 刻画 。 特 别 地 ， 当 > (zw) = 10,1| 时, /~ 便 赔 化 为 一 


个 普通 集合 的 特征 函数 ， 于 是 4 便 赔 化 为 一 个 普通 集合 
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A=|lueUly~ (nu)=1| (8-2) 
因此 ， 普 通 集合 是 模糊 集 的 特殊 情况 ， 
而 模糊 集 是 普通 集合 的 扩展 。 
2. 模糊 集 的 表示 方法 
模糊 集 的 表示 方法 一 般 有 三 种 ， 设 4 为 
论 域 U 上 的 模糊 集合 ，4 中 的 元 素 为 |c ,2， 
ee 各 元 素 所 对 应 的 隶属 函数 为 |1 


0. 8,0.4,0.2,0}。 图 8-1 模糊 集合 的 隶属 函数 
(1) 查 德 表示 法 














4 = tt + (8-3) 
这 里 右 端 项 并 非 分 式 求 和 ， 它 仪 仪 是 一 种 记号 ,分母 位 置 为 论 域 VU 的 元 系 ， 
分 子 位 置 为 相应 元 素 的 隶属 度 。 


当 U 是 连续 论 域 时 ， 给 出 如 下 记 法 : 


= A={u,p~(u lued) (8-4) 
式 中 的 积分 号 不 是 通常 积分 的 意思 ， 而 是 表示 各 个 元 素 与 其 隶属 度 对 应 关系 的 
一 个 总 括 。 
(2) 序 偶 表 示 法 


对 NA (d,0.2),(e,0)| (8-5) 
其 中 每 一 元 素 是 个 序 偶 (x,y) ， 第 一 个 分 量 x 表示 论 域 中 的 元 素 ， 第 二 个 分 
量 y 表示 相应 元 素 的 隶属 度 。 
(3) 癌 量 表示 法 









































A =(1,0.8,0.4,0.2,0) (8-6) 


设 4 、B 为 论 域 VU 上 的 两 个 模糊 集合 ， 则 规定 模糊 集 之 间 的 包含 4 2B、 相 


ie 


ANBBem7 (u) Nr (u) 
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MT 全 1 -人 TU) 
模糊 集 的 并 、 交 、 余 运算 的 几何 意义 如 图 8-2 所 示 。 


1 全 
AUB HA 


Hg 





a) b) 9) 


图 8-2 ”模糊 集 的 基本 运算 
a) 模糊 集 的 并 运算 b) 模糊 集 的 交 运算 c) 模糊 集 的 余 运算 





这 些 运算 具有 有 需 等 律 、 交 换 律 、 结 合 律 、 吸 收 律 、 分 配 律 、 两 极 律 、 复 原 律 和 
对 偶 律 等 性 质 。 并 和 交 的 运算 还 有 多 种 其 他 定义 ,但 常用 的 是 取 大 和 取 小 运算 ， 这 
是 由 于 它们 计算 简单 ， 而 且 能 为 模糊 决策 分 析 提 供 合理 的 解释 。 

除了 以 上 的 并 、 交 、 余 基本 运算 之 外 ， 模 糊 集 还 有 许多 其 他 运算 ， 如 模糊 集 的 
差 、 代 数 和 、 代 数 积 、 有 界 和 、 有 界 积 、 爱 因 斯 坦 积 与 和 以 及 Hamacher 积 与 和 等 。 


8.2.2 隶属 函数 


隶属 函数 的 选取 在 模糊 优化 问题 的 求解 中 是 极其 重要 的 ， 也 数 形状 将 直接 影响 
最 终 的 模糊 最 优 解 。 判 别 隶 属 函 数 是 否 符合 实际 ， 不 是 看 单个 元 素 的 隶属 度 的 数值 
如 何 ， 而 是 要 看 这 个 函数 是 否 正确 反映 了 元 素 从 属于 集合 到 不 属于 集合 这 一 变化 过 
程 的 整体 特性 。 模 糊 数学 已 总 结 出 隶属 函数 的 多 种 方法 ， 可 在 实际 应 用 中 参考 。 

1. 常用 的 两 种 隶属 函数 形式 

(1) 正 态 型 这 是 最 常见 的 一 种 分 布 ， 有 以 下 3 种 。 

1) 降 半 正 态 型 



































~ 1 Xa (877) 
一 - 
和 全 k>0,x>a 
2) 升 半 正 态 型 
大 0 0<x<a (8-8) 
一 
| a k>0,x>a 


3) 正 态 对 称 型 
M(x) =e “*-® ,hk>0 (8.9) 
上 述 正 态 对 称 型 适用 于 模糊 变量 具有 某 种 对 称 性 质 ， 且 随 着 偏离 某 中 心 位 置 ， 
模糊 变量 的 隶属 程度 将 不 断 减 小 ， 如 某 零 件 “ 磨 损 量 大 约 为 某 值 ”这 一 模糊 事物 ， 
就 可 选用 这 种 隶属 函数 加 以 描述 。 正 态 非 对 称 型 可 用 来 描述 模糊 变量 上 下 界 取 值 的 
模糊 允许 范围 。 
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(2) 梯形 分 布 
1) 降 半 梯 形 分 布 














1 Xa 
u(x) = 7 a=x<b (8-10) 
0 b<x 
2) 升 半 梯 形 分 布 
0 xX<a 
p(x) = <x<8 (8-11) 
b<x 
3) 对 称 梯形 分 布 小 
0 xX<a 
Ce a=<x<b 
n(x) =11 b<x (8-12) 
9 c<x sd 
0 X 三 Q 





上 述 分 布 适用 于 模糊 现象 呈 简 单线 性 变化 的 情况 。 工 程 设 计 中 为 简化 起 见 ， 通 
间 将 模糊 设计 变量 上 下 界 的 取 值 区 间 用 梯形 分 布 隶属 函数 加 以 描述 。 

2. 其 他 常用 隶属 函数 类 型 及 突出 重要 程度 参数 调整 方式 

在 多 目标 模糊 优化 中 ， 目 标 之 间 经 常 是 相互 矛盾 的 ， 根 据 各 目标 的 重要 程度 ， 
选取 合适 的 隶属 孙 数 数值 ， 可 调整 最 优 解 在 设计 空间 的 位 置 ， 使 之 向 重要 目标 徘 
近 ， 增 加 重要 目标 最 优 解 的 影响 。 其 他 常用 隶属 函数 类 型 及 参数 调整 方式 
见 表 8-1。 











表 8-1 常用 隶属 函数 类 型 及 参数 调整 方式 




















类 型 隶属 函数 参数 调整 方式 
J ee es (x<a,k >0) 增 大 
ex (x>a,k>0) 
锥 型 由 1 Ix -al)/k 0 +k,k>0) 城 让 > 
柯 西 型 p(s) = Ti (Bk>0) 增 大 
抛物 型 Pe | 0 >0) 增 大 
正 态 型 M(x) =e "(hk>0) 增 大 
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一 般 来 说 ， 从 重要 到 不 重要 的 目标 ， 选 取 隶 属 本 数 的 优先 顺序 依次 为 : 尖 工 
、 锥 型 、 柯 西 型 和 抛物 线 型 。 上 述 顺 序 不 是 绝对 的 ， 隶属 函数 的 形状 一 方面 决定 
其 类 型 ， 男 一 方面 还 取决 于 其 参数 的 大 小 。 
.3 截 集 

模糊 集合 是 通过 隶属 函数 来 定义 的 ， 那么 如 何 从 模糊 集合 中 挑选 出 符合 设计 要 
求 的 集合 ， 实 现 模糊 集合 回 普 通 集合 的 转化 呢 ? 这 时 可 以 取 一 定 的 国 值 或 置信 水 平 


入 ， 即 约定 : 当 元 素 u 对 模糊 集合 4 的 隶属 度 达到 或 超过 A 时 ， 就 算 作 模糊 集合 的 
成 员 ， 这 就 引出 了 截 集 的 概念 ， 它 是 沟通 模糊 集 和 普通 集 之 间 的 桥梁 。 


设 4 是 论 域 VU 上 的 模糊 集合 ， 对 任意 Ae[0,1]， 记 


型 


于 


Go 


2 














A,=|ulueU,n7 (u)=A| 
显然 ， 凡 是 一 个 经 典 集合 ， 由 论 域 0 中 对 模糊 集合 4 的 隶属 度 达 到 或 超过 和 


的 元 素 所 组 成 的 集合 ， 当 A 的 取 值 由 1 逐渐 减 小 而 趋向 零 时 ， 相 应 的 4 ,逐渐 向 外 
扩展 ， 从 而 得 到 一 系列 的 普通 集合 。 从 设计 的 观点 来 看 ， 即 一 个 模糊 设计 的 问题 转 
化 为 一 系列 不 同 置信 水 平 A 的 传统 设计 问题 ， ,， 
如 零件 的 许 用 应 力 存在 着 一 个 模糊 区 间 ， 用 降 

半 梯 形 分 布 隶属 函数 表示 为 


0, 一 ( 厂 





Me 一 (ox<0,) (8-13) 4 
OD» Ol 


式 中 ，o ,和 o, 为 许 用 应 力 的 上 、 下 限 ， 这 样 可 
以 取 一 系列 A = 代入 式 〈8-13) ， 便 可 求 出 不 
同 设计 置信 水 平和 A 的 许 用 应 力 ， 如 图 8-3 所 示 。 
再 按 设计 目标 的 要 求 ， 通 过 优化 方法 选择 最 佳 
的 许 用 应 力 设 计 方 案 。 图 8-3” 许 用 应 力 的 隶属 函数 








G1 O02 


8.2.4 模糊 扩展 原理 





模糊 扩展 原理 实质 上 是 指 用 映射 /， 将 论 域 VU 上 的 模糊 集合 4 变 为 论 域 了 上 的 
模糊 集合 B 时 ， 确 定 B 的 隶属 函数 的 原则 和 方法 ， 可 描述 如 下 : 








设 X，X,，…， 于 ,， 了 为 不 同 的 论 域 ; 4 |,，4 ;,，…，4 ,为 模糊 集 ， 且 4,C 
X,; X=X XxX X“ xxX 为 笛 卡 儿 乘 内， 映射 7 太 为 
f=X—Y 


(wi ,NX2 一 Sy Ee ER 
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f 在 y 上 产生 一 个 模糊 集 B 为 
B 二 | [yn B (y)] | i ;> (i | eX| (8-14 ) 

其 中 B=-f(A) 
pF(y)= V | Sy 


y =f(x1,%2,", 





模糊 扩展 原理 表明 ， 系 统 模糊 输入 4 (模糊 
力 、 模 糊 位 移 、 模 糊 材 料 属性 等 ) 通过 映射 B = 


f( 4 )， 可 将 其 隶属 函数 毫 无 保留 地 传递 下 去 ， 这 
样 ， 任 意 一 模糊 输入 量 的 性 质 必 将 传递 给 一 模糊 响 
应 量 ， 如 图 8-4 所 示 。 图 8-4 模糊 扩展 原理 


8.2.5 ”模糊 优化 的 数学 模型 


进行 模糊 优化 设计 之 前 ， 首 先 要 建立 其 数学 模型 ， 与 普通 优化 设计 的 数学 模型 
= ue 3 : 量 、 目 标 消 数 和 约束 条 件 三 个 基本 要 素 。 

1. 设计 变 

设计 变 山寺 过 本 市 丰 况 站 下 丰 业 六 赤 必 是 一 般 包括 结构 的 几何 参数 、 材 
料 特 性 参数 等 。 由 于 设计 问题 的 复杂 性 ， 设 计 变 量 可 以 是 确定 的 、 随 机 的 和 模 
糊 的 。 

2. 目标 函数 

目标 函数 是 衡量 设计 优 劣 的 指标 ， 根 据 问 题 的 性 质 ， ee 一 个 或 多 个 目标 也 
数 。 目 标 消 数 一 般 包括 结构 的 质量 、 造 价 、 刚 度 、 固 有 上 频率、 惯量 和 可 靠 性 等 性 能 
指标 。 设 计 方 案 的 优 劣 本 号 就 是 一 个 模糊 概念 ， nn 特别 是 对 
于 多 目标 优化 设计 ， 目标 孔 数 之 间 通 常 都 是 相互 矛盾 的 ， 往 往 得 不 到 理想 解 ， 而 只 


得 到 满意 解 。 如 果 目 标 函数 是 模糊 的 ， 记 作 (XX)。 

3. 约束 条 件 

约束 条 件 在 设计 空间 中 形成 一 个 可 行 域 ， 只 有 满足 所 有 约束 条 件 的 设计 才 认 为 
是 可 行 设计 ， 否 则 为 不 可 行 设计 。 约 束 条 件 一 般 分 为 三 个 方面 一 是 几何 约束 ， 如 
结构 尺寸 与 形状 约束 等 ; 二 是 性 能 约束 、 如 应 力 约 束 、 刚 度 约束 、 位 移 约束 、 频 率 
约束 和 稳定 性 约束 等 ;三 是 人 文 因素 约束 ， 如 政治 形式 约束 、 经 济 政策 约束 、 环 境 
因素 约束 等 。 以 上 约束 条 件 ， 特 别 是 人 文 因素 约束 和 性 能 约束 条 件 中 ， 包 含 大 量 的 
模糊 信息 。 根 据 约束 的 模糊 性 质 ， 又 把 模糊 约束 分 为 两 类 。 


(1) 广义 模糊 约束 ”其 模糊 约束 条 件 可 以 表达 为 g,(X) CG(j=1,2,…,/])。 
式 中 ，g ,( 尺 ) 代 表 应 力 、 位 移 、 频 率 等 模糊 物理 量 ; G, 是 g; (站 ) 所 允许 的 范围 ， 其 
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意义 为 模糊 量 g ,() 在 模糊 意义 下 落 入 模糊 允许 区 间 C 。 

(2) 普通 模糊 约束 、 当 g ,() 为 非 模糊 量 时 ,约束 条 件 变 为 g,() CG， 这 
是 工程 设计 中 最 常见 的 一 种 情况 ， 其 意义 为 确定 量 g,(X) 在 模糊 意义 下 落 入 模糊 允 
许 区间 C 。 

设计 变量 、 目 标 函 数 和 约束 条 件 ， 三 者 都 可 以 是 模糊 的 ， 也 可 以 某 一 方面 是 模 
糊 的 而 其 他 方面 是 确定 的 或 随机 的 ， 但 只 要 其 中 一 项 包含 了 模糊 信息 ， 该 优化 问题 
即 为 模糊 优化 问题 。 当 设计 变量 、 目 标 函 数 和 约束 条 件 中 都 具有 模糊 性 时 ， 模 糊 优 
化 的 数学 模型 可 以 表示 为 

求 和 = (CW, X2， ” ,2 


min f (不 ) 






































St RC sd 
8.2.6 ”模糊 允许 区 间 上 下 界 的 确定 


对 于 模糊 优化 设计 ， 建 立 模糊 约束 的 隶属 函数 后 ， 还 必须 确定 模糊 允许 区 间 的 
上 下 界 ， 即 模糊 集合 过 渡 区 的 范围 ， 其 方法 有 许多 种 ， 这 里 仅 介 绍 工程 中 用 得 比较 
多 的 扩 增 系数 法 。 

扩 增 系数 法 在 充分 考虑 常规 设计 所 积累 的 经 验 基础 和 常规 设计 规范 所 给 出 的 许 
用 值 基础 上 ， 通 过 引入 一 扩 增 系数 B 来 确定 过 渡 区 间 的 上 下 界 。 这 里 以 确定 许 用 应 
力 的 上 下 界 为 例 来 说 明 : 普通 的 应 力 约束 可 写 为 ao<1o]， 这 里 [og] 由 设计 规范 
给 出 ， 是 一 种 不 合理 的 刚性 约束 ， 如 果 考 虑 许 用 应 力 [o] 存在 一 个 模糊 区 间 ， 则 
可 取 [o] 过 渡 区 间 的 上 、 下 界 为 

o<[o],o<Blo] 

式 中 扩充 了 许 用 应 力 的 上 界 ， 也 可 根据 情况 扩充 下 界 或 同时 扩充 上 下 界 ，B 的 
大 小 可 根据 约束 的 性 质 或 模糊 综合 决策 来 确定 。 该 方法 在 设计 规范 所 给 出 的 许 用 值 
的 基础 上 ， 通 过 引入 一 扩 增 系数 B 来 确定 过 渡 区 的 上 下 界 ， 是 一 种 简单 适用 的 工程 
方法 。 














8.3 单 目 标 模糊 优化 设计 


8.3.1 检 代 法 


迭代 法 适合 于 求解 对 称 模糊 优化 问题 。 对 称 的 模糊 优化 是 指 目 标 和 约束 在 优化 
问题 中 是 同等 重要 的 ， 因 而 模糊 目标 集 和 模糊 约束 集 的 交集 中 存在 一 个 点 ， 它 同时 
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使 目标 和 约束 得 到 最 大 程度 的 满足 。 其 形式 为 ， 在 论 域 VU 上 ， 模糊 目标 集 为 F， 
模糊 约束 集 为 G， 则 它们 的 交集 D = FN G 称 为 模糊 优越 集 。 
设 模 糊 约束 集 6 的 入 水 平 截 集 为 
C = {XIGC=A,XeU| (8-16) 
则 模糊 优越 集 的 最 大 值 为 
IO en eT = max [A A max f (X)] C7 
利用 上 述 定理 ， 可 以 构造 一 个 迭代 寻 优 的 准则 ， 建 立 一 套 迭 代 寻 优 的 具体 方 
法 。 对 于 求解 对 称 模糊 优化 问题 可 归结 为 求 


A = max f (X) =max d (X) (8-18) 





的 问题 ， 只 要 求 得 这 样 的 +" ， 则 在 水 平 截 集 G, .下 极 大 化 模糊 目标 函数 (和 )， 便 
可 得 到 问题 的 最 优 解 " 。 我 们 称 A “为 最 优 入， 相应 的 水 平 截 集 为 最 优 水 平 截 集 。 
由 式 (8-18) 知 
A” — max f (X) =0 (8-19) 
由 于 A“ 是 唯一 的 ， 只 有 当 入 为 最 优 时 ， 式 〈8-19) 才 成 立 ， 否 则 将 不 等 于 雪 ， 
因此 ， 我们 可 以 把 式 (8-19) 作为 一 个 准则 ， 把 寻求 最 优 和 最 优 解 的 过 程 ， 归 结 
为 使 








eH = -max f (X) (8-20) 


发 E CA(N) 
逐渐 趋 于 零 的 过 程 。 工 程 上 ， 并 不 要 求 得 到 绝对 满足 式 (8-19) 的 最 优 解 ， 而 只 要 
求 式 (8-20) 的 se” 为 小 于 预先 给 定 的 一 个 非 负 小 量 即 可 ， 因 此 ， 寻 求 最 优 和 最 优 
解 的 过 程 ， 可 归结 为 使 








[A®— FHCR) SS 


逐渐 得 到 满足 的 过 程 ， 其 中 , h = 1，2，3，…，mn， 表 示 和 迭代 次 数 ; / (于) = 
,max / (于) 表示 第 次 迭代 的 水 平 截 集 Gu 上/ (X) 的 最 大 值 。 一 般 预 先 给 定 收 


敛 精度 ,通常 =10“”~10”“”， 可 根据 需要 选取 。 
上 述 解法 的 迭代 步骤 如 网 8-5 所 示 。 


8.3.2 最 优 水 平 截 集 法 


1. 求解 原理 
如 果 只 有 约束 条 件 是 模糊 的 ， 而 目标 函数 是 清晰 的 ， 则 该 模糊 优化 问题 为 非 对 
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称 模 糊 优化 问题 ， 可 利用 最 优 水 平 截 集 法 求解 。 


作 水 平 截 集 
Gm=-EXIG (X)> 240 


/=1,2,.…,/} 


求解 优化 问题 


求 XX 
max/f(X) 

st GX) 40 (=1,2,.…,) 
得 4X9， /CX 


e020 PX) 





输出 : XO，HFCx) 


ACTD = 4AM -a ee 


图 85 对称 模 糊 优化 解 的 迭代 框图 


设 z (gj(X) ) 为 物理 量 g,(X) 对 模糊 允许 区 间 6 ,的 隶属 度 ， 则 g,(X) 对 模糊 
约束 的 满足 度 ， 可 记 为 





B;=n ¢ ,(g(X)) (LS 
当 B; =1 时 ， 该 约束 得 到 严格 的 满足 ; 当 B; =0 时 ， 该 约束 未 得 到 满足 ; 当 0 < 

Bi <1 时 ， 该 约束 得 到 一 定 程度 的 满足 。 
模糊 允许 范围 6 ,在 设计 空间 划 出 一 个 具有 模糊 边界 的 模糊 允许 域 和 模糊 不 允 
许 域 ， 因 此 ， 所 有 模糊 约束 在 设计 空间 围 成 了 一 个 具有 模糊 边界 的 可 用 域 ， 记 为 
of, (822) 


式 (8-22) 表示 设计 空间 的 模糊 可 用 域 Q 是 所 有 模糊 约束 空间 6G,(j =1,2,…， 


四 的 交集 。 也 就 是 说 ，Q 中 的 每 一 个 可 用 点 是 所 有 6 ,的 可 用 点 ， 它 们 在 满足 度 大 
于 零 的 意义 下 满足 所 有 模糊 约束 。 
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对 于 广义 模糊 约束 来 说 ， 可 将 模糊 约束 记 为 
Qe EC (8-23) 
式 (8-23) 表示 广义 模糊 约束 0 就 是 要 求 模糊 约束 函数 g ,在 模糊 意义 下 落 入 
模糊 允许 区 间 G,。 因 此 ， 对 此 模糊 约束 的 满足 度 B, 必 须根 据 模糊 约束 函数 g ,的 隶 
属 函 数 B; = > 的 图 形 ， 以 及 它 的 模糊 允许 区 间 6 的 隶属 函数 uz 的 图 形 的 相对 位 
置 来 定义 。 
如 图 8-6 所 示 ， 当 & ,完全 落 入 C; 内 时 ， 相 当 于 8 ,的 隶属 函数 图 形 完 全 落 和 人 6， 


的 隶属 函数 图 形 内 ， 约 束 得 到 完全 满足 ， 此 时 满足 度 B, = 1; 当 p > ,和 jz 的 图 形 重 
琶 时 ， 约 束 得 到 一 定 程度 的 满足 ， 此 时 0 <p; <1; 


当 g ;的 隶属 函数 图 形 落 入 C ,的 隶属 函数 图 外 时 ,约束 完 全 没有 得 到 满足 ， 此 
时 满足 度 B, =0。 





a) b) 5) 


图 8-6 模糊 约束 满足 度 
a) B;=1 b) 0<B;<1 e) B;=0 


2. 普通 模糊 约束 的 优化 问题 
根据 上 述 原理 ， 其 求解 的 基本 思想 是 : 通过 和 水 平 截 集 将 模糊 子 集 6 分 解 为 
若干 个 普通 集合 C, ， 然 后 求 目标 函数 f(X) 在 G6, 上 的 极 值 ， 进 而 求 得 在 G 上 的 模糊 
条 件 极 值 ， 即 在 模糊 允许 区 间 G 中， 在 隶属 度 wz (g) 二 和 A(Ae[0,1]) 的 区 间 构 成 
实数 论 域 上 的 一 个 普通 子 集 ， 即 
G,= {glu¢ (CS) 三 人 | 
可 以 看 出 ， 两 个 不 同 的 水 平 截 集 满足 
》 二 )2 一 CU CA 
即 和 值 越 小 ，C 的 区 间 就 越 大 ， 当 入 =0 时 ， 包 括 了 全 部 的 允许 域 ; 当 和 =1 
时 ， 变 为 最 严格 的 区 间 。 因 此 在 机 械 结构 模糊 优化 设计 过 程 中 ，A 可 以 理解 为 “ 设 
计 水 平 ”的 概念 ， 在 实际 优化 过 程 中 可 以 取 不 同 的 值 ， 便 得 到 一 系列 的 水 平 最 优 
解 ， 供 决策 者 选择 ， 其 中 必然 存在 一 个 最 优 的 和 " ， 与 之 相应 的 水 平 截 集 为 
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Ch =1gIME(S) EU=12，1) 

Cu， 称 为 最 优 水 平 截 集 。 用 此 水 平 截 集 代替 全 部 的 模糊 允许 区 间 ， 模 糊 优化 问 

题 可 以 转化 为 具有 设计 水 平 的 非 模糊 优化 问题 ， 即 
人 ) 








(8-24 
st ne (8)A (Ted 
此 ， 具 有 普通 模糊 约束 的 非 对 称 模糊 优化 问题 的 具体 解 题 步骤 如 下 : 


1) 使 约束 条 件 模糊 化 ， 建 立 各 个 模糊 允许 区 间 G ,的 隶属 函数 ; 
2) 寻求 一 最 优 水 平 值 A*; 
3) 作 模 糊 约束 C 的 最 优 水 平 截 集 G, . ， 将 模糊 问题 转化 为 6, .上 的 常规 优化 
问题 ; 
4) 用 常规 的 解法 求 式 〈8-24) ， 即 得 到 模糊 优化 问题 的 最 优 解 素 * 。 
3. 广义 模糊 约束 的 优化 问题 
广义 模糊 约束 的 优化 问题 求解 方法 与 普通 模糊 优化 问题 的 基本 一 致 ， 即 引入 一 
A， 将 广义 模糊 约束 的 优化 问题 转化 为 求 常 规 优 化 问题 ， 即 
A 
1 bt BX) EA Gl,2,3)) 
改变 和 值 可 得 到 一 系列 普通 优化 模型 ， 从 而 得 到 一 系列 优化 方案 ， 如 果 已 求 
得 最 优 水 平 " ， 则 可 得 到 相应 的 最 优 水 平 截 集 ， 即 
人 := {XIB(X) A ,XeU(j=1,2,.…,))| 





(8-25) 








0 = (0). 
则 模糊 优化 问题 可 记 为 
ee 
st XN ee 
综 上 所 述 ， 求解 具有 广义 模糊 约束 的 非 对 称 模糊 优化 问题 的 最 优 水 平 截 集 法 步 
又 如 下 : 
1) 建立 设计 变量 对 对 广义 模糊 约束 0 的 满足 度 B, (站) ; 
2) 寻求 一 最 优 水 平 值 A”; 
3) 作 模 糊 约束 4 的 最 优 水 平 截 集 2,. ， 将 模糊 问题 转化 为 Q, .上 的 常规 优化 
问题 ; 
4) 用 常规 的 解法 求 式 (8-26)， 即 得 到 模糊 优化 问题 的 最 优 解 立 ”。 
4. 最 优 水 平 截 集 的 确定 
用 最 优 水 平 截 集 法 求解 模糊 优化 问题 时 ， 关 键 问 题 是 确定 最 优 水 平 截 集 ， 即 确 


(8-26 ) 
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定 最 优 的 什 ， 主 要 有 规划 法 和 模糊 绿 合 评判 法 。 

1) 规划 法 的 基本 思想 是 : 由 于 最 优 A” 值 应 使 得 结构 既 安 全 可 知 ， 又 经 济 节 
省 ， 因 此 A“ 值 应 根据 结构 的 初始 造价 C(X& ) 和 结构 使 用 中 所 需 补充 的 费用 (维修 
费用 、 灾 害 损失 费用 等 ) 的 期 望 值 到 (已 ) 来 决定 。 初 始 造 价 和 期 望 值 既是 的 洛 
数 ， 故 也 是 入 的 函数 。 随 着 和 的 增 大 ，G(X, ) 值 增 大 ，E(X ) 值 减 小 ， 因 此 ， 确 定 
A “的 问题 ， 可 归结 为 求解 如 下 的 数学 规划 问题 ， 即 

i =G(A) +E(A) 








s. t. 0<A=I 
此 规划 问题 的 最 优 解 ， 即 为 所 求 的 最 优 A“ 值 。 
2) 模糊 综合 评判 法 就 是 应 用 模糊 变换 原理 对 其 所 考虑 的 事物 进行 综合 评价 。 
当 对 上 述 的 最 优 水 平 值 进行 决策 时 ， 几 是 对 结构 安全 可 徘 和 经 济 方 省 有 影响 的 因 
素 ， 如 设计 水 平 、 制 造 水 平 、 材 料 好 坏 、 重 要 程度 、 使 用 条 件 、 维 修 保养 费 等 ， 都 
可 以 作为 集中 因素 加 以 考虑 。 首 先 建立 因素 集 、 评 价 集 ， 进 行 单 因素 模糊 评判 ， 建 
立 权 重 集 ， 最 后 进行 模糊 综合 评判 ， 根 据 需 要 可 来 用 一 级 模糊 综合 评判 、 二 级 模糊 
综合 评判 和 多 级 模糊 综合 评判 ， 详 细 步 骤 见 有 关 的 参考 资料 。 




















8.4 多 目标 模糊 优化 设计 


大 部 分 工程 优化 问题 都 含 多 个 优化 目标 ， 并 受 多 个 等 式 和 不 等 式 约 束 。 设 计 目 
标 经 第 是 互相 矛盾 的 ， 所 以 不 能 同时 达到 最 优 。 例 如 ， 在 设计 一 个 传动 效 置 时 ， 硕 
望 它 的 重量 最 轻 、 承 载 能 力 最 高 ， 同 时 又 要 使 它 的 寿命 最 长 ; 在 设计 高 速 凸 轮机 构 
时 ， 不 仅 要 求 体积 最 小 ， 而 且 要 求 其 柔性 误差 最 小 、 动 力 性 能 最 好 等 。 因 此 ， 设 计 
者 用 经 典 数 学 建立 系统 的 正确 模型 的 困难 变 得 更 大 ， 处 理 这 样 的 问题 需要 借助 于 模 
糊 理论 。 


8.4.1 对 称 多 目标 模糊 优化 模型 的 求解 
对 于 具有 了 个 模糊 目标 、J 个 模糊 约束 的 多 目标 模糊 优化 问题 ， 当 给 出 论 域 UV 


上 的 模糊 目标 集 P,( = 1,2,…,7) 和 模糊 约束 集 G,(j =1,2,…,J]) 时 ， 对 称 条 件 下 
的 模糊 判决 为 





























其 隶属 函数 为 
I J 
ns(X)=[ Axr (XA Axs,X)] 
最 优 解 为 使 模糊 判决 的 隶属 函数 取 最 大 值 的 X" ， 即 
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WF (XK) =maxxp(¥) 
采用 直接 解法 求解 时 ， 上 式 可 归结 为 求解 如 下 的 常规 优化 问题 : 


max A 入 
AeR,XeR" 


st F(X) AGI=1,2,.…,)) (0<A<1) (8-27) 
0 RN 


8.4.2 普通 多 目标 模糊 优化 问题 的 求解 


这 类 多 目标 模糊 优化 问题 的 数学 模型 为 


Pp 


G = 门 G = 1XIXeR’ ,gs,(X) <0 (=1,2,.…,)]) ,8; (于) <0G=J+1,T +2,.…,p)| 
jd 
(8-28) 


对 于 6 中 每 一 模糊 约束 6 ,的 约束 上 下 限 给 出 容 差 4,， 并 采用 线性 隶属 函数 7 ， 
( 革 ) ， 如 图 8-7 所 示 ， 则 











1 ， g(X)<b 
KZ,(X) = te br <BX) Kb td (=)) 
0 ， g(X)=b +d: 
0， gi(X) <b;-d; 
We,(¥) = 2 站 0 b’ -d,s<g(X)<b (j= +1,)+2,.…,p) 
1 ， g(X)=0 
4 可 CO) 





图 8-7 线性 隶属 函数 wg ，(X) 
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应 该 指出 ， 各 子 目 标 函 数 订 X) (i=1,2,…,7) 可 能 的 最 小 值 m 受 到 约束 条 件 模 
糊 性 的 影响 ， 而 其 可 能 的 最 大 值 M; 又 受到 其 子 目 标 函 数 最 小 点 的 影响 。 因 此， 在 
满足 模糊 约束 条 件 的 多 目标 优化 情况 下 ， 各 子 目 标 孔 数 / (站 ) 将 在 特定 的 区 间 内 变 
化 ， 形 成 模糊 目标 最 小 集 己 ,。 构 造 隶属 函数 w > ;( 巨 ) 的 具体 步 又 如 下 

1) 求 各 子 目 标 孔 数 在 约束 条 件 最 宽松 情况 下 可 能 的 最 小 值 ， 即 

minf.(X) (i=1,2,.…,7) 
s. t. g (XX) <b +d’ (j=1,2,…,)]) 
g(X)=0 -dd(j=J+1,]+2,.…,p) 

用 常规 优化 方法 求 得 其 解 为 X，， 最 小 值 为 f(X; )。 将 X; 代入 其 余 的 子 目 标 函 
数 ， 得 (Xi) (1=1,2,…,1,lzi)。 

2) 找 出 各 子 目 标 孔 数 可 能 的 最 小 值 m, 和 最 大 值 M;， 即 

mi;= minfi(X, ) =fi(X; ) 















































(i=1,2,.…,7) 
re 
3) 构造 各 子 目 标 函数 模糊 目标 集 F ,的 隶属 函数 
5 f£.(X) Em, 
M,; —f.(X) 


全 = (是 M. 一 人 
KF,(¥) M,—m, ? m,; </f.( ) < (1 ] 过 ,7) 


0 f:(X)=M., 


4) 构造 综合 模糊 目标 集 玉 和 综合 模糊 约束 集 6 的 模糊 判决 D 的 隶属 函数 ， 求 
出 最 优点 对 "使 最 优 判决 为 





LF(X ) = maxnp 7 (X) 
为 适应 对 工程 设计 不 同 决策 思想 的 需要 ， 可 采用 不 同形 式 的 模糊 判决 ， 交 模糊 
判决 、 凸 模糊 判决 和 积 模糊 判决 。 
交 模 糊 判 决 的 隶属 函数 定义 为 











ny (X)=| Anz CD] At Nn ¢ ,(X) | 
则 式 (8-28) 所 示 的 普通 多 目标 模糊 优化 问题 转化 为 
maxp % (X)=A 
s.t. MF (X)=A(i=1,2,.…,7) 
ME (X)=A(I=1,2,.…,p) 


0=<A=1 


是 模糊 判决 的 隶属 函数 定义 为 


(8-29) 
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Mj (X) = BD opr(X) + DY wns,(X) (8-30) 
其 中 
De 
w, 宇 0 
w=0 
则 式 (8-28) 所 示 的 普通 多 目标 模糊 优化 问题 转化 为 
maxu 5 (X) = 之 wk 久 这) 证 2 wh ¢,(X) 
0 Cet) 
g(X) 0 -d= +1,+2,.…,p) 
积 模糊 判决 的 隶属 孔 数 定义 为 
m3(X) = [ (Hr.(%)) (Hxz®)] 
则 式 (8-28) 所 示 的 普通 多 目标 模糊 优化 问题 转化 为 
maxx3 (xX) = [ (Hr ): (Hz)] 
本 > (8-32) 


s.t.g (XX) <b +d() = 1,2,.…,)) 
g (KX) = +d (= +1,)+2,..,p) 

经 过 严格 的 理论 证 明 ， 应 用 上 述 不 同形 式 的 模糊 判决 求 得 的 满意 解 均 为 弱 有 效 
解 。 交 模糊 判决 反映 了 使 各 子 目 标 和 各 约束 中 最 差分 量 得 到 改善 的 谨慎 思想 ， 其 结 
果 仅 使 最 差分 量 极 大 化 ， 而 其 余 量 在 一 定 范围 内 变化 并 不 直接 影响 结果 ， 丢 失 了 不 
少 信息 。 凸 模糊 判决 属于 算术 平均 型 判决 ， 它 涉及 各 子 目 标 、 各 约束 之 间 的 相对 重 
要 性 ， 反 映 了 对 各 方面 均 有 所 考虑 的 平均 思想 ， 表 达 明 确 、 直 观 ， 且 对 重要 指标 的 
作用 易于 掌握 。 积 模糊 判决 属于 几何 平均 型 判决 ， 即 从 几何 平均 意义 上 考虑 各 子 目 
标 、 各 约束 分 量 的 影响 。 


8.4.3 多 目标 模糊 优化 的 分 层 序列 法 


在 菜 些 多 目标 优化 设计 问题 中 ， 存 在 着 一 些 特 别 重 要 的 目标 ， 如 条 这 些 重 
要 的 目标 疫 有 达到 最 优 ， 则 不 考虑 其 他 目标 。 例 如 ， 进 行 精 密 机 床 设 计时 首先 
需要 考虑 主轴 的 刚度 满足 要 求 ， 然 后 再 考虑 质量 等 其 他 目标 。 针 对 这 些 问题 ， 
多 目标 优化 分 层 序 列 法 已 能 很 好 地 解决 ， 推 广 到 多 目标 模糊 优化 情况 ， 可 将 模 
型 表示 为 


















































第 8 章 ”模糊 优化 设计 | 163 
minF(X) = A(X) p(X CE ) 


st g(F) bj=1,2,.,1) 
g(X) OI=1+1,l+2,..,m) (8-33) 


h(X) =c()=1,2,.…,n) 
h(X)=c(j=n+t+l,n+2,..,9) 
该 模型 中 既 包 含 模糊 不 等 式 、 等 式 约 束 ， 叉 包含 非 模 糊 不 等 式 、 等 式 约束 。 
为 求解 该 模型 ， 首 先 将 式 (8-33) 中 的 了 个 目标 按 重 要 程度 分 成 > 组 ， 每 组 中 
的 目标 函数 个 数 分 别 为 p1 ，p;，…，p,，pP1 +ps +…+p, =7， 其 中 第 一 组 中 的 产 个 
目标 也 数 优 先 级 最 高 ， 应 首先 得 到 满足 ， 这 样 原 多 目标 模糊 优化 问题 便 化 为 7 个 多 
目标 模糊 优化 子 问题 。 
第 一 个 模糊 优化 子 问题 为 
minFi(X) = (A(X) ,p(X) 2 











s. t. g(X) Sb (j=1,2,.,1) 
g(X)<b I=1+1,l+2,..,m) (8-34) 


h (KX) =c()=1,2,.,n) 
h(X)=c(j=n+t+l,n+2,..,9) 
式 (8-34) 可 用 下 列 模 型 求解 


minAi 
XeR" 


s. t. A1 p(X) (7=1,2,.,p1) 
A me (X) (T=1,2,.,0) 
gi (KX) SLT=L+1,L+2,.,m) 
A ur (X(T=1,,2,.,n) 
h(X)=c(j=n+t+l,n+2,..,9) 
上 述 模 型 共 含 有 原 模型 式 (8-33) 中 的 pi 个 日 标 函 数 ， 可 用 前 述 的 普通 多 日 标 
优化 方法 求解 。 
第 二 个 模糊 优化 子 问 题 与 第 一 个 子 问题 形式 类 似 ， 只 是 目标 孔 数 为 
TeX a XT a 
约束 条 件 在 第 一 个 子 问题 约束 条 件 的 基础 上 再 加 上 下 式 : 
Qs -Mr 和 OCT=1 2,PI) 
式 中 ，a 为 系数 ， 一 般 取 0.9 ~0.95。 该 系数 的 大 小 限制 了 前 面 已 求 得 的 较 重要 的 
目标 函数 隶属 度 的 取 值 范 围 ， 这 样 就 在 求解 过 程 中 ， 使 重要 目标 的 隶属 度 得 到 保 


(8-35) 
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证 ， 同 时 优化 其 他 次 要 目标 的 隶属 度 。 
第 二 个 模糊 优化 子 问题 为 


maxA， 
XeR" 


SB oo 
A, mu (X) (i=p +1 ,pi +2,.…,p: +p,) 
A < (F) (=1,2,.,1) (8-36) 
g;(X) <b(j=L+1,L+2,.…,m) 
As < (X) (j=1,2,.,n) 
h(X)=c(j=nt+l,n+2,..,9) 
依 此 类 推 ， 下 到 求解 第 7 个 子 问题 ， 最 后 得 到 的 模糊 最 优 解 即 为 所 求 的 解 。 


8.4.4 基于 模糊 综合 评判 的 多 目标 优化 设计 方法 
对 设计 方案 优 劣 进行 评判 必须 要 有 一 定 的 基础 (如 设计 指标 等 )， 而 评判 结果 
通常 以 评语 集 的 形式 表示 。 设 评语 集 V 中 有 p 类 评语 vw， ，v,，…，v,， 如 很 好 、 好 、 
一 般 、 差 、 很 差 等 。 设计 方案 1 的 评语 巨 (1N) 用 模糊 形式 可 写 为 
B(M) =(b,b,,…,b,) 
式 中 ，b, (k=1,2,…,p) 是 对 应 于 评语 v,(k =1,2,…,p) 的 隶属 度 ， 有 日 5, 表 征 的 是 方 
案 必 隶 属于 评语 wv 的 程度 。 如 果 b, =1,，b; =0(i=1,2,…,k 一 1,k+1,…,p)， 则 模 


糊 评 判 就 赔 化 为 确定 性 评判 B (M) =(w ) 。 
在 多 个 目标 共存 的 情况 下 ,决策 者 对 设计 方案 MM 的 评判 常用 模糊 关系 矩阵 


R (MM) 表 示 ， 即 














bi bi, 0 

0 1 b 
R (M) 21 27 

bn bp b, 


引入 权重 集 
W= (wi ,Wa 207) 


7 
式 中 ，w,; 三 0， >》 20i :is 
i 
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丈 反 映 了 对 诸 目标 因素 的 一 种 权衡 。 一 般 地 ， 决 策 评判 集 了 可 由 模糊 关系 矩阵 
R 与 权重 集 W 通 过 模糊 变换 求 得 ， 即 


~ 


J =W.: R=VinwNna] = (j,i,),) 
式 中 ， 信 代表 某 种 合成 运算 。 

在 多 目标 情况 下 ， 由 于 各 目标 相互 制约 ， 一 般 不 存在 绝对 最 优 解 。 决 策 者 追求 
的 是 对 方案 的 评价 尽 可 能 的 优越 。 在 评判 集中 ,方案 “ 优 ” 的 隶属 度 应 尽 可 能 地 
大 ， 而 方案 “ 差 ” 的 隶属 度 应 尽 可 能 地 小 。 

设 方案 评语 集 为 了 = (v1,v,，…,v,)， 其 中 vw 为 “最 理想 ”， bw 为 “次 理想 ”2 
为 “最 不 理想 ”。 在 p 维 评判 空间 中 定义 理想 评判 集 为 


J 3 《并 3 |) 0 05 

















与 之 相应 的 点 称 为 理想 评判 点 。 在 评判 空间 上 引进 某 个 模 | ，|| ， 并 考虑 在 这 
个 模 的 意义 下 实际 评判 点 与 理想 评判 点 之 间 的 “距离 "， 即 
d0J)=|7 -| 


以 dy ) 为 新 的 优化 目标 ， 求 得 评判 点 尽 可 能 接近 理想 点 的 解 即 为 原 优化 问题 
的 解 。 每 一 评判 点 代表 着 一 个 评判 集 ， 因 此 d( J ) 表 示 的 是 两 模糊 子 集 之 间 的 “ 距 
| O 

两 模糊 子 集 4 、B 间 的 距离 可 采用 下 列 的 带 权 的 一 一 模 闵 可 夫 斯 基 
(Minkowski) 表示 式 进 行 计算 。 











式 中 , 1 7, 表示 模糊 子 集 4 的 第 i 个 隶属 度 ; 人 3 ,表示 模糊 子 集 4 与 8 的 第 i 个 隶属 
度 ; wi; 表示 第 i 个 隶属 度 的 权重 。 


当 g =1 时 ， 上 式 即 为 囊 权 的 汉 明 距离 (Hamming distance) dy,( A B ) ; 当 g = 
2 时 ， 上 式 即 为 带 权 的 欧 氏 距离 (Euclid distance) ds(4,B)， 即 





di(A,B) = 





ds(A,B) 
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这 样 基于 模糊 综合 评判 的 优化 模型 可 归结 ; 
min [Ply -7 了 -7 
s.t. g;(X) <0 


式 中 ，J 为 方案 综合 评判 集 隶 属 度 ; 7 “为 理想 评判 集 隶 属 度 。 
8.5 模糊 优化 设计 实例 


弹簧 是 通用 机 械 堆 件 ， 在 一 些 机 需 〈 如 内 燃 机 、 压 缩 机 ) 中 所 用 弹 曲 性 能 的 
好 坏 直 接 影 响 到 机 需 的 整体 性 能 ， 而 弹 千 设计 的 正确 与 否 是 前 提 条 件 ， 本 节 对 弹 千 
设计 引入 模糊 优化 方法 。 

试 设计 一 内 燃 机 气门 弹簧。 气门 完全 开启 时 ， 弹 得 最 大 变形 量 6 = 16. 59mm， 
工作 载 集 =680N， 工 作 频 率 w =25Hz， 最 高 工作 温度 150°%， 材 料 为 50CrVA 钢丝 。 
结构 要 求 为 : 弹 黎 丝 直 径 2.Smm 三 vd 达 10mm， 弹 答 中 径 30mm 三 邦 过 60mm， 工 作 
圈 数 3<n<15， 旋 绕 比 C=6， 质量 尽 可 能 少 。 

1. 设计 变量 

影响 弹 签 质 量 的 设计 变量 ; 

和 = Co 一 Gr 











2. 目标 函数 
弹 先 质量 为 
W=d (nD,) (n+n)p 
式 中 ，m 为 弹 得 支承 圈 数 ， 取 n, =2; p 为 钢丝 密度 ， 取 p =7.8 x10 kg/m 。 
代入 n,、p 值 ， 并 引入 设计 变量 x,，x,，x3， 上 整理 后 可 得 日 标 浮 数 为 
f(X) =1.925 x10 “xix, (x3 +2) 





3. 约束 条 件 

考虑 到 许 用 应 力 、 高 径 比 、 旋 绕 比 及 设计 变量 的 界限 均 存 在 有 从 完全 许 用 到 完 
全 不 许 用 的 过 渡 区 间 ， 都 应 视 作 设计 空间 的 模糊 子 集 ， 这 样 得 约束 条 件 如 下 。 

(1) 强度 条 件 























38k .FD, ~ 
gy | 
D a _ 
式 中 ,为 曲 度 系数 ， 当 C= 一 =4~9 时 ， 经 曲线 拟 合 得 =1.95C 一 一 ;， [7] 


To 


为 弹 筑 丝 许 用 切 应 力 ， 篆 规 下 Lrj] = 二 4 Xx1.1=405MPa。 


写 全 
(2) 稳定 性 条 件 
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H,/D,<b 
式 中 ，h, 为 弹 得 自由 高 度 ， 有 = (n+ns -0.5d) +1.16; b 为 高 径 比 ， 常 规 下 弹 纂 
两 端 均 为 固定 端 时 ,5 =5. 3。 
(3) 无 共振 条 件 ( 弹 得 两 端 均 为 固定 端 时 ) 


i 
(n+n,)D; SE 





3.56 x10” x 


式 中 ，w 为 工作 频率 ，w =25Hz。 
(4) 刚度 条 件 
8FDan ~ 
Gd 
式 中 ，G 为 弹 签 丝 材料 切 变 模 量 ,对 50CrVA，G = 80000MPa; 6 =16. 59mm。 





De 
2 og dq 


式 中 ，C 为 旋 绕 比 ， 常 规 下 取 4<C<16， 按 题目 要 求 ，C=6 时 , 取 C=6, C=16。 
(5) 设计 变量 取 值 界限 
dsd=d, D,<D,<D,, nsn=n 
式 中 , d=2.5mm, d=10mm; D; =30mm, DD 
值 ) 。 
4. 优化 结果 
采用 最 优化 水 平 截 集 法 求解 ， 当 转化 为 常规 优化 模型 后 ， 用 约束 变 尺 度 法 上 机 
求解 ， 其 模糊 优化 结果 为 
X* =(5.221,28. 886,2.724)', f(X"* ) =0.07126 
按 标准 处 理 弹 得 各 参数 后 得 
d=6mm, D, =35mm, n=2.75, W=0.11Skg 


OO 


mm 
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9.1 ISIGHT 优化 设计 简介 及 实例 


9.1.1 ISIGHT 优化 设计 简介 


任何 一 项 产品 的 开发 、 生 产 都 是 多 领域 知识 综合 、 多 方面 需求 协调 的 结果 ， 对 
复杂 产品 来 说 更 是 如 此 。 基 于 多 方面 知识 的 文 持 及 满足 多 方面 需求 的 设计 称 为 多 学 
科 设 计 。 因 此 ， 多 学 科 有 两 方面 的 含义 : 其 一 是 指 设计 产品 所 需 知识 所 属 的 知识 领 
域 ; 其 二 是 指 产品 需 满足 的 各 种 性 能 。 例 如 ， 汽 车 设计 需要 机 构 学 、 固 体力 学 、 材 
料 学 、 流 体力 学 、 电 工 电子 等 学 科 的 知识 ， 同 时 在 性 能 方面 有 燃油 消耗 、 寿 命 、 安 
全 性 等 方面 的 要 求 。 从 这 一 角度 来 说 ， 多 学 科 设 计 思想 由 来 已 入 ， 它 体现 在 任何 一 
项 产品 的 设计 过 程 中 。 人 然而 根据 传统 的 设计 思想 ,不 易 实 现 多 学 科 相 互 影响 、 相 互 
制约 下 产品 有 效 的 并 行 协同 优化 设计 ， 因 此 人 们 提出 了 多 学 科 设 计 优 化 的 思想 
( Multidisciplinary Design Optimization ，MDO ) 。 要 实现 多 学 科 设 计 优 化 的 任务 ， 首 
先 要 有 一 个 集成 化 的 设计 环境 ， 目 前 已 有 多 种 集成 设计 优化 软件 ， 其 中 美国 Enge- 
nious 公司 开发 的 ISIGHT 软件 应 用 较 广 。 除 ISIGHT 这 样 的 集成 设计 优化 软件 外 ， 
一 些 商 业 软 件 如 ANSYS、IDEAS 等 也 具有 多 学 科 分 析 优 化 的 功能 ， 但 这 些 软件 基 
本 上 都 是 按 顺 序 的 方式 进行 工作 。ISIGHT 的 运行 流程 如 图 9-1 所 示 。 


设计 任务 
分 析 与 分 解 
输入 设计 
变量 初 人 
仿真 分 析 软件 
输出 计算 结果 











































ISIGHT 与 
仿真 分 析 软 件 


耦合 协议 


















更 新 设计 变量 


满足 设计 
要 求 吗 ? 


ISIGHT 优 化 分 析 













ISIGHT 与 
仿真 分 析 软 件 
耦合 协议 


图 9-1 ISIGHT 集成 设计 优化 工作 流程 
ISIGHT 最 早 是 由 美 籍 华人 唐 兆 成 〈Siu Tong) 在 20 世纪 80 年 代 左右 提出 并 领 
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导 开 发 完成 的 ， 经 过 这 些 年 的 发 展 已 经 成 为 同类 软件 中 的 佼佼 者。JISICHT 自身 并 
不 会 进行 计算 ， 但 是 它 通 过 相应 的 方法 调用 其 他 软件 (如 ABAQUS、ANSYS 等 ) 
进行 计算 ; ISIGHT 是 一 种 过 程 集成 、 优 化 设计 和 稳健 性 设计 的 软件 ， 可 以 将 数字 
技术 、 推 理 技术 和 设计 探索 技术 有 效 融 合 ， 并 把 大 量 的 需要 人 工 完 成 的 工作 由 软件 
实现 自动 化 处 理 ， 好 似 一 个 软件 机 器 人 在 代替 工程 设计 人 员 进 行 重复 性 的 、 易 出 错 
的 数字 处 理 和 设计 处 理工 作 ，ISIGHT 软件 可 以 集成 仿真 代码 并 提供 设计 智能 支持 ， 
从 而 对 多 个 设计 可 选 方案 进行 评估 、 研 究 ， 大 大 缩短 了 产品 的 设计 周期 。 

自 2003 年 正式 成 立 进 入 中 国 市 场 以 来 ，ISIGHT 迅速 获得 了 国内 航空 、 航 天 、 
船舶 、 汽 车 、 电 子 、 兵 希 、 高 校 等 领先 的 全 究 部 门 认可 ， 以 下 简要 介绍 ISICHT 设 
计 流 程 。 

下 面 通 过 ISIGHT 集成 C 语言 ， 如 何 使 用 ISIGHT 软件 完成 优化 设计 任务 。 其 
主要 步骤 如 下 。 

1. 编写 目标 函数 及 状态 变量 计算 程序 

编写 文本 文件 作为 ISIGHT 输出 输入 数据 流 。ISIGHT 通过 对 这 两 个 文件 进行 解析 ， 
建立 ISIGHT 与 应 用 程序 数据 流传 输 协 议 ， 实 现 数据 传输 。 应 用 程序 需 预先 调试 通过 。 

2. 启动 ISIGHT 软件 建立 一 个 新 的 设计 任务 

进入 主 界面 。 该 界面 控制 ISIGHT 的 整个 工作 流程 ， 包 括 : 中 集成 应 用 仿真 软 
件 或 程序 (Integrate) ; 人 设置 优化 模型 参数 (Parameters ) ， 这 一 操作 的 目的 是 设 
定 目 标 孔 数 ， 告 诉 ISIGHT 是 求 目 标 晒 数 最 大 值 还 是 最 小 值 ， 设 定 设计 变量 初 值 及 
上 上、 下限 ,设置 状态 变量 约束 ; 多 设 置 优化 策略 ; 由 设置 数据 库 文 件 (Database ) ; 
@) 设 置 执 行 过 程 数据 监视 (Monitor) ; 9) 执行 设计 任务 (Execute) ; 《OO 分 析 计 算 结 

3. 集成 应 用 仿真 软件 或 程序 

通过 单 击 Integrate 按钮 进入 集成 应 用 仿真 软件 或 程序 界面 。 单 击 工 具 栏 上 的 
Simcode 按钮 ， 调 出 集成 应 用 程序 导航 沫 单 及 模块 集成 工作 区 ， 单 击 某 单 栏 Sim- 
code( ) 节点 下 Program( ) 菜单 项 左边 的 属性 按钮 ， 在 模块 工作 区 出 现 输入 、 输 出 、 
程序 3 个 模块 ， 在 每 一 模块 左边 有 对 应 的 属性 按钮 及 进入 输入 、 输 出 文件 解析 界面 
的 按钮 。 首 先 单 击 应 用 程序 Program ( ) 左边 的 文件 属性 按钮 ， 进 入 导入 应 用 程序 
界面 ， 按 要 求 的 路 径 输 入 应 用 程序 名 后 ， 再 返回 集成 环境 界面 。 接 着 导入 数据 输入 
文件 。ISIGHT 并 不 是 将 更 新 后 的 设计 变量 值 直 接 写 入 应 用 程序 的 输入 文件 ， 而 是 
写 和 人 中 间 模 板 文件 ， 因 此 在 导入 数据 输入 文件 时 还 要 给 出 数据 输入 中 间 模 板 文件 ， 
该 文件 可 直接 通过 复制 输入 文件 并 更 名 建立 。 然 后 单 击 输入 文件 模块 左边 的 输入 内 
容 按钮 ， 进 入 输入 文件 解析 界面 。 

文件 解析 界面 工作 区 显示 输入 文件 中 的 内 容 ， 并 有 一 红色 光标 出 现在 字符 串 的 
左 端 ， 高 亮 选 中 该 字符 串 及 冒号 后 的 空格 ,自动 进入 查找 字符 串 界面 ,确认 字符 串 
文本 框 内 的 文字 后 再 返回 本 界面 。 接 着 单 击 替换 按钮 ， 进 入 用 设计 变量 名 符 换 选中 字 
符 串 界面 ， 完 成 后 按 确认 键 ， 返 回 本 界面 。 在 动作 列表 区 显示 执行 的 命令 。 文 件 解析 
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命令 告诉 ISIGHT 更 新 数据 文件 ， 光 标 如 何 移动 ， 数 据 传 给 哪个 变量 。 如 果 有 多 个 设 
计 变 量 ， 则 重复 这 样 的 操作 。 输 出 文件 的 导 人 与 文件 解析 和 对 输入 文件 的 操作 类 似 。 

4. 设置 优化 模型 参数 

完成 第 3 步 的 操作 后 ， 保 存 相 应 的 设置 ， 返 回 主 界面 。 单 击 参数 设置 按钮 ， 进 
入 优化 模型 参数 设置 界面 。 按 设计 要 求 确定 目标 函数 ， 并 说 明 是 求 最 大 值 还 是 求 最 
小 值 ; 设置 设计 变量 初 值 、 状 态 变量 约束 条 件 。 

5. 选择 优化 策略 

ISIGHT 有 多 种 优化 算法 可 供用 户 选择 。 为 了 便于 用 户 选 择 ，ISICHT 软件 能 够 
根据 用 户 设置 的 优化 模型 参数 为 用 户 推 存 优化 算法 ， 供 用 户 参考 ,用 户 也 可 将 其 作 
为 选 定 的 优化 算法 ， 这 里 用 其 推荐 的 算法 。 

6. 设置 数据 库 文件 

7. 设置 运行 过 程 监视 方式 

8. 执行 设计 任务 

单 击 执行 按钮 后 ， 和 迭代 过 程 的 有 关 变 量 值 在 预先 设置 的 监视 界面 中 显示 。 

运行 结束 后 可 在 参数 界面 、 运 行 监视 界面 查看 和 分 析 计 算 结 果 。 


9.1.2 ISIGHT 优化 设计 实例 


例 9-1 一 个 农夫 用 周 长 为 100m 的 储 笃 来 围 一 块 矩 形 业 地 ， 试 问 长 和 宽 为 多 
少时 所 围 沫 地 面积 最 大 ? 

解 : (1) 局 动 ISIGHT 并 搬入 一 计算 骨 

单 击 集成 按钮 过 进入 集成 开发 环境 ， 单 击 图 中 标示 处 插入 计算 器 ， 如 图 9-2 所 示 。 


悦 :Process Integration: {CUNTITLEDY 3 _ | 口 | x| 
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万 Task Process 
只 [+t] 地 Taski 


图 9-2 集成 开发 界面 
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(2) 编写 计算 公式 
单 击 图 9-3 中 的 任 一 标示 处 。 


圭 'process Integration: 【UNTITLED) 





办 File Edit Yiew Inset Tools Help 


多 注油 蜀 国 名 天 涉世 CO 加 








大 Task Process 
=$ [ 习 地 Task1 


转 Calculation0 





4 el 4 RE 
Fraskerasaa /7 


图 9-3 ”计算 需 界 面 
弹出 的 界面 内 编写 计算 公式 如 图 9-4 所 示 。 


Process Integration: Calculation 司 寺 





Enter a sedquence ofassignrments tor -prefixed commentsy. 





sll Parameters —i | All Functions —l | 


abst 
acos 总 
acosho 


acotn 
acothgi 


a 
b 
d 


verify Syntax Store walues acscha 


aseco 
Calculate Now asecho 


asind 可 


Ok | Cancel | Help | 


图 9-4 编写 计算 公式 
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单 击 确定 ， 可 以 看 到 集成 环境 下 界面 多 了 输入 输出 数据 流 如 图 9-5 所 示 。 


性 Process Integratiqes Bb 





: 二 加 本 
心 Be Eh Integration: Data Flow 寺 
> 而 From: -INP 一 ! 
To: Calculation0 一 二 
Task Process 
中 电驴 Task1 a Es 


因 转 calcula b 





UL 有 


TaskTask1 











图 9-5 输入 输出 数据 流 


双击 选 定数 据 线 可 以 看 到 输入 参数 和 输出 参数 。 
(3) 编辑 参数 
单 击 集成 界面 下 的 参数 按钮 弹出 参数 编辑 界面 ， 如 图 9-6 所 示 。 


: UNTITLED} 











一 一 一 ion: Parameters 对 
区 ee 
转 Calculatior a npo tea 
b input real 
d output real 
[9 


output real 












































图 9-6 参数 编辑 界面 





可 以 对 参数 进行 编辑 ， 鼠 标 左 键 单 击 对 应 的 表格 就 可 以 更 改 参数 Mode 、Type 等 。 
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(4) 保存 文件 

弹出 如 图 9-7 所 示 对 话 框 ， 单 击 “Save (need)”， 再 在 随后 弹出 的 类 似 于 word 
文件 存储 的 对 话 框 中 ， 选 择 存储 路 径 、 定 义 文件 名 、 保 存 文件 ， 然 后 关闭 集成 开发 
界面 ， 进 入 ISIGHT 主 界面 。 


Process Integration: {UNTITLEDY 









图 9-7 计算 器 保存 界面 


(5) 定义 约束 和 目标 参数 
单 击 主 界面 的 参数 按钮 弹出 参数 编辑 界面 ， 定 义 参数 和 约束 如 图 9-8 所 示 。 


4 i5IGHT: Parameters - Task1 EE 至 -lolx| 
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EE 


图 9-8 定义 参数 约束 
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(6) 选择 优化 算法 
单 击 主 界面 的 标示 图 标 弹 出 算法 定义 对 话 框 选择 优化 算法 ， 如 图 9-9 所 示 ， 黑 
认 人 情况 下 ISIGHT 会 日 动 选择 算法 。 
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图 9-9 ”优化 算法 对 话 框 


可 以 直接 单 击 OK 接受 默认 算法 ， 也 可 以 自己 选择 算法 ,具体 操作 如 图 9-10 
所 示 。 
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图 9-10 自己 定义 优化 算法 
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(7) 设置 输出 显示 
设置 输出 显示 ， 如 图 9-11 所 示 。 


局 15IGHT: Task Manager = rnyfirsttest ,desc 
Fle Edt Wew Control Execullon Tools Help 


必 X 台 目 旬 本 ea 汪 末日 四 古诗 量 共 和 二 














Run Mode Est Max Runs Run Courier 


Task Plan 1420 1 





EE BIGMT: Solution Monitor - myfirstbest.dese 
国 Elle Edit View lInsart Tools Heip 





虽 划 贡 加 BP 回国 办 


万 Solution Monitor views 
口 TasManager 
和 Taskl 





Table Description 


Custom Table; Allows custom selection 
of iSIGHT paramaters to 人 rm a table 











| 
图 9-11 设置 输出 显示 界面 


单 击 OK 弹出 如 图 9-12 所 示 界 面 。 
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观 击 该 突 口 可 弹出 答 出 窗口 
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图 9-12 输出 显示 界面 





175 


176 | 机 械 优化 设计 与 实例 


(8) 求解 
鼠标 左 键 弹 出 图 9-13 所 示 标 示 可 以 选择 求解 方案 。 


二 iSIGHT: Task Manager - myfirsttest.desc -lo| x| 
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| | 
图 9-13 求解 方案 选取 界面 


单 击 主 界面 图 9-14 计算 按钮 进行 求解 。 


态 iSIGHT: Task Manager - myfirsttest.desc 祥 -lo|xl 
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万 Tasks Run Mode Est. Max. RUns RUn Counter 


和 TasHi Task Plan | 1420 1 


| FE 
图 9-14 求解 按钮 标示 


(9) 求解 结果 显示 

弹出 一 个 对 话 框 显示 最 优 解 的 相关 信息 如 图 9-15 所 示 ， 该 结果 也 可 以 在 结 
文件 内 查 到 。 从 图 9-14 可 以 看 出 ， 边 长 分 别 为 25m 时 ， 围 成 的 菜 地 面积 最 大 。 

(10) 保存 关闭 ISIGHT 
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所: isSIGHT: Solution Monitor - myfirsttest.desc -本 -| 口 | x| 
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11 25.025 25.0 i100.05 625.625 
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图 9-15 结果 显示 


9.2 MATLAB 优化 设计 简介 


MATLAB 是 一 种 面 问 科学 与 工程 计算 ， 被 广泛 用 于 目 动 控制 、 机 械 设 计 、 流 
体力 学 和 数理 统计 等 工程 应 用 领域 的 编程 计算 工具 软件 。MATLAB 名 字 由 matrix 和 
laboratory 两 词 的 前 三 个 字母 组 合 而 成 ， 意 为 矩阵 实验 室 。MATLAB 专门 以 矩阵 形 
式 来 处 理 数 据 ， 它 将 计算 和 可 视 化 集成 到 一 个 灵活 的 计算 机 环境 中 ， 并 提供 了 大 量 
的 内 置 函 数 ， 可 以 在 广泛 的 工程 问题 中 直接 使 用 这 些 函 数 ， 尤 其 是 在 优化 设计 中 具 
有 编程 人 简单、 可 用 内 置 函 数 多 、 概 念 明确 等 特点 。 


9.2.1 主要 特点 


1. 编程 容易 ， 效 率 高 

MATLAB 包含 丰富 的 可 供 直 接 调 用 的 库 函 数 ， 避 人 免 了 对 大 量 算法 的 重复 编程 ; 
并 且 人 允许 用 户 使 用 接近 “数学 形式 ”的 语言 编写 程序 ， 被 誉 为 高 级 “数学 演算 纸 
和 图 形 显示 器 ”的 科学 算法 语言 。 和 其 他 编程 语言 相 比 ， 其 编程 工作 量 少 、 效 
率 高 。 

2. 调试 方便 

MATLAB 是 一 种 解释 执行 性 语言 ， 它 将 其 他 语言 使 用 过 程 的 编辑 、 编 译 、 连 
接 、 执 行 和 调试 等 步骤 融 为 一 体 ， 并 且 在 同一 个 窗口 上 处 理 程序 中 可 能 出 现 的 语法 
错误 或 逻辑 错误 ， 因 此 程序 调试 比 VB 更 加 简单 方便 。 
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3. 扩充 性 好 

MATLAB 的 库 函 数 与 用 户 文件 在 形式 上 是 一 样 的 ， 所 以 用 户 文件 可 以 作为 库 
消 数 进行 调用 ， 同 时 可 根据 需要 建立 和 扩充 新 的 库 子 数 。MATLAB 核心 文件 和 工 
具 箱 文件 都 是 可 读 写 的 源 文件 ， 用 户 可 以 根据 需要 对 其 进行 修改 或 编制 新 的 工 
具 箱 。 

4. 交互 性 、 可 移植 性 及 开放 性 好 

MATLAB 可 以 对 用 户 原 有 的 Fortran 和 C 语言 程序 通过 建立 M 文件 形式 的 混合 
编程 的 方法 进行 调用 ; 在 Fortran 和 C 语言 中 也 可 以 方便 地 使 用 MATLAB 的 数值 计 
算 功 能 。 

5. 方便 的 绘图 功能 

MATLAB 有 一 系列 简单 明了 、 功 能 齐全 的 绘图 函数 和 命令 ， 可 以 在 线性 坐标 、 
( 半 ) 对 数 及 极 坐 标 系 中 绘制 二 维和 三 维 图 形 ， 实 现 了 数据 的 可 视 化 ， 并 且 可 以 方 
便 地 对 图 形 进行 注释 ， 使 用 非常 方便 。 

6. 语法 简单 ， 内 酒 丰 富 

MATLAB 语言 中 最 重要 的 部 分 是 消 数 ， 其 库 消 数 功 能 丰 定 ， 大 大 减 小 了 需要 
的 磁盘 空间 ， 使 得 MATLAB 编写 的 M 文件 简单 、 短 小 而 高 效 。 

7. 高 效 、 方 便 的 矩阵 和 数组 运算 

MATLAB 可 以 像 C 语言 等 高 级 语言 一 样 进行 矩阵 的 算术 、 关 系 、 逻 辑 、 条 件 
及 赋值 运算 。 另 外 ， 不 用 预先 定义 数组 的 维 数 并 给 出 矩阵 函数 、 特 殊 和 矩阵 专门 的 库 
函数 ， 从 而 在 系统 辨识 、 系 统 仿 真 、 信 号 处理、 控制 及 优化 等 领域 的 应 用 显得 简 
捷 、 高 效 、 方 便 ， 这 是 其 他 高 级 语言 所 不 能 比拟 的 。 


9.2.2 MATLAB 程序 设计 流程 简介 


M 文件 分 脚本 文件 和 函数 文件 两 种 。 脚 本 文件 一 般 用 来 实现 相对 独立 的 功能 
或 作为 主 函 数 ， 而 函数 文件 则 实现 特定 的 函数 功能 ， 可 以 有 参数 的 传递 ， 函 数 文件 
有 独立 的 内 部 变量 空间 ， 在 函数 调用 结束 后 内 部 变量 空间 将 释放 。 函 数 文件 的 编制 
有 利于 提高 程序 的 可 读 性 、 稳 定性 ,减少 程序 间 变 量 的 相互 干扰 。 注 意 在 函数 的 命 
名 规则 上 有 字母 、 数 字 和 下 画 线 三 种 合法 的 字符 ， 首 字母 必须 为 字母 。 

在 文件 的 结构 上 ， 荫 数 文件 需要 采用 function 进行 声明 。 

M 文件 的 结构 主要 还 是 根据 需要 ,合理 地 设计 三 大 结构 (顺序 、 选 择 、 循 环 ) 
的 组 合 。 

选择 结构 有 过、else 、esleif 、end ;switch 、case 、otherwise 等 关键 词 。 

循环 结构 有 for 、end 结构 和 while、end 结构 ， 以 及 continue 、break 等 控制 
语句 。 

注意 : MATLAB 语言 是 注释 性 语言 ， 在 编程 的 过 程 中 要 及 时 调试 、 保 存 并 对 
程序 进行 合理 注释 ， 变 量 的 命名 做 到 见 名 知 意 ， 对 于 调试 过 程 中 的 出 错 信 息 要 认真 
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研读 并 改正 。M 文件 相互 调用 前 应 将 各 文件 保存 在 同一 路 径 下 ， 注 意 虚 参 的 传递 
顺序 要 相同 。 


9.2.3 MATLAB 优化 工具 箱 简 介 


MATLAB 6.5 的 优化 工具 箱 (optimization toolbox) 中 含有 一 系列 优化 算法 元 
数 ， 可 以 用 于 解决 以 下 工程 实际 问题 : 求解 无 约束 条 件 非 线性 极 小 值 ; 求解 约束 条 
件 非 线 性 极 小 值 ， 包 括 目 标 副 近 问 题 、 极 大 极 小 值 问题 、 半 无 限 极 小 值 问 题 ; 求解 
线性 规划 和 二 次 规划 问题 ; 非 线 性 最 小 二 乘 逼 近 和 曲线 拟 合 ; 非 线性 方程 求解 ; 约 
束 条 件 下 的 线性 最 小 二 乘 优化 ; 求解 复杂 结构 的 大 规模 优化 问题 。MATLAB 常用 
的 工具 箱 王 数 见 表 9-1。 


表 9-1 MATLAB 常用 的 工具 箱 函 数 
































问题 分 类 也 数 
线性 规划 jig 
多 变量 优化 ee 
曲线 拟 合 lsqcurvefit 
最 小 二 乘法 lsqnonlin 
单 变量 优化 fiminbnd 
多 变量 优化 fmincon 
二 次 项 优化 quadprog 
半 无 穷 优 化 fseminf 
多 目标 优化 i 





fgoalattain 


优化 工具 箱 的 一 般 使 用 步骤 如 下 : 首先 ， 根 据 实际 文件 建立 最 优化 问题 的 数学 
模型 ， 确 定 变 量 ， 列 出 约束 条 件 和 目标 也 数 。 其 次 ， 对 建立 的 模型 进行 具体 分 析 和 
研究 ， 选 择 合适 的 优化 求解 方法 。 最 后 ， 根 据 优 化 方法 的 算法 ， 列 出 程序 框图 ， 选 
择优 化 函数 和 编写 程序 并 求解 。 实 际 使 用 时 请 参看 MATLAB 帮助 文件 。 


9.2.4 MATLAB 优化 设计 实例 


例 9-2 有 A、B 两 种 产品 ，A 产品 在 第 一 车 间 的 加 工时 间 为 0.8h， 在 第 二 
间 的 加 工时 间 为 1.2h; B 产品 在 第 一 车 间 的 加 工时 间 为 1. 4h， 在 第 二 车 间 的 加 工 
时 间 为 0.6h。 两 个 车 间 每 月 有 200h 的 时 间 可 供 加 工 产品 A、B，B 产品 的 市 场 需求 
为 150 件 / 月 ， 假 定 每 件 A、B 产品 的 利润 分 别 为 4 元 和 5 元 ， 求 利润 最 大 时 A、B 
产品 的 月 产量 。 

解 : 假定 A 产品 的 月 产量 为 x;，B 产品 的 月 产量 为 x,， 则 目标 孔 数 和 约束 条 
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作坊 
min f(xi,x;) = —4x, 一 9x， 
s.t 0.8xi +1.2x, 近 200 
1. 4x; +0. 6x, 200 
x, 150 
X 人 
所 以 Va=[=6 3 


不 等 式 约束 关系 可 表示 为 





0.8 1.2 200 
1.4 NE 
0 1 人 ?Al150 
程序 清单 如 下 : 

f=| -4, -5| 

A =[0.8,1.2;1.4,0.6;0,1]; 

B =[200,200,150] 

LBnd =[0,0]; 

x=linprog(f,A,B,|[ | ,| | ,LBnd,| |) 

程序 执行 的 结果 是 A 产品 的 月 产量 为 100 件 ，B 产品 的 月 产量 为 100 件 。 








9.3 ANSYS Workbench 优化 设计 简介 


ANSYS 提供 了 两 种 优化 的 方法 ， 这 两 种 方法 可 以 处 理 绝 大 多 数 的 优化 问题 。 
堆 阶 方法 是 一 个 很 完善 的 处 理 方法 ， 可 以 很 有 效 地 处 理 大 多 数 的 工程 问题 。 一 阶 方 
法 基于 目标 函数 对 设计 变量 的 敏感 程度 ， 因 此 更 加 适合 于 精确 的 优化 分 析 。 

对 于 这 两 种 方法 ，ANSYS 提供 了 一 系列 的 分 析 一 评估 一 修正 的 循环 过 程 。 就 
是 对 于 初始 设计 进行 分 析 ， 对 分 析 结 采 就 设计 要 求 进行 评估 ， 人 然后 修正 设计 。 这 一 
循环 过 程 重复 进行 直到 所 有 的 设计 要 求 都 满足 为 止 。 除 了 这 两 种 优化 方法 ，ANSYS 
还 提供 了 一 系列 的 优化 工具 以 提高 优化 过 程 的 效率 。 例 如 ， 随 机 优化 分 析 的 迭代 次 
数 是 可 以 指定 的 。 随 机 计算 结 采 的 初始 值 可 以 作为 优化 过 程 的 起 点 数值 。 

ANSYS Workbench 可 以 用 Design Explorer 来 实现 产品 性 能 的 快速 优化 ， 本 节 就 
人 简单 介绍 Design Explorer 优化 设计 基础 。 











9.3.1 Design Explorer 基础 








Design Explorer 主要 帮助 设计 人 员 在 产品 设计 和 使 用 前 确定 哪些 不 确定 因素 对 
产品 零 部 件 究 竟 有 多 大 的 影响 ， 而 且 能 确定 如 何 才 能 更 好 地 提高 产品 的 可 靠 性 ， 在 
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Workbench 中 所 有 这 些 任务 都 是 利用 响应 面 来 完成 的 。 用 户 使 用 参数 是 Design Ex- 
plorer 的 基本 语言 ， 而 各 类 参数 可 以 来 自 Mechanical ，DesignModeler 和 不 同 的 CAD 
系统 。 下 面 简单 介绍 Design Explorer 的 基本 功能 。 

1. 定义 参数 

Design Explorer 中 共有 三 类 人 参数: 

(1) 输入 参数 (Input Parameters) 输入 参数 可 以 从 几何 体 、 载 入 或 材料 的 
属性 中 设 定 。 如 可 以 在 CAD 系统 或 DesignModeler 中 定义 厚度 、 长 度 等 作为 Design 
Explorer 中 输入 参数 ， 也 可 以 在 Mechanical 中 定义 压力 、 力 或 材料 的 属性 作为 输入 

(2) 输出 参数 (Output Parameters) ”典型 的 输出 参数 有 体积 、 质 量 、 频 率 、 
应 力 、 热 流 、 临 界 届 曲 值 、 速 度 和 质量 流 等 输出 值 。 

(3) 导出 参数 (Derived Parameters) ”导出 参数 是 指 不 能 直接 得 到 的 参数 ， 所 
以 导出 参数 可 以 是 输入 和 输出 参数 的 组 合 值 ， 也 可 以 是 各 种 也 数 表 达 式 等 。 

2. 优化 方法 设 定 

Design Explorer 中 进行 优化 设计 分 析 是 通过 面 〈 线 ) 响应 来 完成 的 ， 其 支持 方 
法 是 实验 数据 法 (The Design of Experiment method ) ， 简 称 DOE 法 ， 一 旦 运算 结 
啊 应 面 〈 线 ) 的 曲面 〈 线 ) 的 拟 合 点 就 是 通过 设计 点 来 完成 的 。 

3. Design Explorer 的 特征 

Design Explorer 作为 ANSYS WORKBENCH 中 的 快速 优化 工具 ， 我 们 从 上 面 的 
内 容 知 道 实际 上 它 是 通过 设计 点 (可 以 增加 设计 点 ) 的 参数 来 研究 输出 或 导出 参 
数 的 ， 但 因 一 般 输 入 设计 点 是 有 限 的 ， 所 以 也 是 通过 有 限 个 设计 点 拟 合成 啊 应 曲面 
( 线 ) 来 研究 的 ， 其 中 包括 : 

(1) 目标 驱动 优化 〈Goal 一 Driven Optimization) 简称 GDO。 实 际 上 它 是 一 种 
多 目标 优化 技术 ， 是 从 给 出 的 一 组 样本 中 来 得 到 一 个 “最 佳 ” 的 结 末 。 其 一 系列 
的 设计 目标 都 可 用 于 优化 设计 。 

(2) 相关 参数 (Parameter Correlation ) 这 用 于 得 到 输入 参数 的 敏感 性 ， 也 就 
是 说 可 以 得 出 某 一 输入 参数 对 相应 曲面 的 影响 究竟 是 大 还 是 小 。 

(3) 啊 应 曲面 (Response Surface) ”这 主要 用 于 能 直观 地 观察 到 输入 参数 的 影 
啊 ， 图 表 形 式 能 动态 地 显示 输入 与 输出 参数 间 的 关系 。 

(4) 6c 设计 (six sigma) ”这 主要 用 于 评估 产品 的 可 徘 性 概率 ， 其 技术 上 是 基 
于 6 个 标准 误差 理论 。 判 断 产 品 是 否 符 合 达 到 6c 标准 。 

4. Design Explorer 的 特点 

作为 快速 优化 工具 ，Design Explorer 有 很 多 特点 ， 主 要 有 : 

各 种 类 型 的 分 析 均 可 被 研究 ， 如 可 以 对 线性 、 非 线性 、 模 态 、 温 度 、 流 体 、 电 
磁 、 多 物理 场 等 进行 优化 ; 

Design Explorer 支持 本 机 上 不 同 CAD 系统 中 的 参数 ， 这 一 点 对 熟悉 在 CAD 软 
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件 中 进行 参数 化 建 模 的 用 户 带 来 了 很 大 的 方便 ; 

支持 Mechanical 中 的 参数 ， 在 ANSYS Workbench 中 的 许多 仿真 都 是 在 Mechani- 
cal 中 进行 的 ， 而 Design Explorer 能 直接 使 用 Mechanical 中 的 参数 ; 

利用 目标 驱动 优化 技术 就 能 创建 一 组 最 佳 的 设计 点 ， 还 能 观察 响应 曲线 和 响应 
曲面 的 关系 ; 

可 以 方便 地 进行 6c 设计 ， 还 文 持 从 APDL 语言 中 定义 的 参数 。 

一 个 典型 ANSYS Workbench 的 优化 过 程 通常 需要 经 过 参数 化 建 模 、 后 处 理 求 
解 、 优 化 参数 评价 、 优 化 循环 、 设 计 变 量 状态 修正 等 步 又 来 完成 ， 其 数值 优化 的 流 
程 如 图 9-16 所 示 。 



















状态 变量 及 目标 函数 


参数 优化 评估 


收 
伍 


最 优 , 退出 


图 9-16 典型 的 ANSYS Workbench 优化 过 程 


非 最 优 ,修正 设计 变量 


9.3.2 ANSYS Workbench 拓扑 优化 设计 简介 及 实例 


拓扑 优化 是 指 形状 优化 ， 有 时 也 称 为 外 形 优 化 。 拓 扑 优 化 的 目标 是 寻找 承受 单 
载 傈 或 多 载荷 的 物体 的 最 佳 材料 分 配方 案 。 这 种 方案 在 折 扑 优化 中 表现 为 “最 大 
刚度 ”设计 。 

本 节 对 一 支架 原始 模型 进行 了 形状 拓扑 优化 计算 ， 目 的 是 在 确保 其 承载 能 力 的 
基础 上 减 重 40% ， 分 析 使 用 的 软件 针对 普通 设计 工程 师 的 快速 分 析 工 具 Design 
Explorer， 该 软件 具有 使 用 方便 、 快 捷 ， 不 需要 具备 有 限 元 基本 知识 的 特点 。 利 用 
DesignExplorer 的 拓扑 优化 功能 ， 得 到 了 文 架 模型 在 承受 固定 载 傈 下 ， 以 减 小 的 材 
料 重 量 为 状态 变量 ,保证 结构 刚度 最 大 的 拓扑 形状 ， 为 后 期 的 详细 设计 提供 了 依 
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据 。 为 了 市 省 时 间 和 提高 运算 速度 ， 计 算 中 把 一 些 不 影响 精度 的 特征 去 掉 ， 所 使 用 
的 可 以 进行 拓扑 优化 的 原始 几何 模型 如 图 9-17 所 示 。 





个 


ys 0 























图 9-17 ”几何 模型 


DesignExplorer 定义 拓扑 优化 问题 同 定义 其 他 线 弹 性 结构 问题 做 法 一 样 。 需 要 
定义 材料 特性 (弹性 模 量 和 泊 松 比 ， 也 许 还 有 材料 密度 ) ， 选 择 拓扑 优化 合适 的 单 
元 类 型 ， 生 成 有 限 元 模型 ， 并 根据 特定 的 拓扑 优化 问题 需要 的 判 据 ， 进 行 施 加 载 从 
和 边界 条 件 做 单 载 伍 或 多 载体 线性 结构 议 力 分 析 ， 或 者 施加 边界 条 件 做 模 态 分 析 。 
本 例 做 支架 的 结构 静 力 分 析 。 其 具体 的 分 析 过 程 如 下 。 

(1) 选择 分 析 类 型 。 选 择 拓扑 优化 分 析 ShapeOptimization 。 

(2) 导入 PROE 软件 创建 的 几何 模型 。 

(3) 添加 材料 信息 。 支 架 材料 为 ANSYS Workbench 默认 材料 结构 钢 structural 
Steel, 

(4) 设 定 网 格 划 分 参数 并 进行 网 格 划 分 。 

1) 选择 Mesh， 右 击 ， 选 择 网 格 尺寸 命令 Sizing。 

2) 在 Sizing 的 属性 菜单 中 ， 选 择 整 个 支架 ， 并 指定 网 格 尺寸 为 20 mm。 

3) 选择 Mesh， 右 击 ， 选 择 网 格 尺寸 命令 Method。 

4) 在 Method 的 属性 菜单 中 ， 选 择 整个 支架 ,并 指定 剖 分 方法 为 四 面体 单元 
Tetrahedrons ， 网 格 模 型 如 图 9-18 所 示 。 

(5) 施加 载 全 以 及 约束 。 

1 ) 选择 Supports-Fixed Support。 

2) 在 支架 模型 中 选择 支撑 端 两 孔 面 ， 施 加 固定 约束 ， 如 图 9-19 所 示 。 

3) 在 文 架 模型 自由 端 孔 上 施加 力 载 伍 ， 选 择 Loads-Force， 力 的 方向 和 大 小 为 
X=10 N,，Y=5 N， 如 图 9-220 所 示 。 
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图 9-18 ”网 格 模型 





图 9-19 ”添加 约束 








图 9-20 ”施加 载荷 
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(6) 设 定 求解 (结果 ) 参数 ， 即 设 定 要 求解 何 种 问题 、 哪 些 物 理 量 。 

1) 激活 Solution， 右 击 ， 在 弹出 菜单 中 选择 Insert-Shape Finder。 

2) 在 Shape Finder 属性 菜单 中 ,定义 拓扑 优化 目标 Target Reduction 为 40% ， 
如 图 9-21 所 示 。 


Details of "Shape Finder" 








图 9-21 设置 拓扑 优化 日 标 


(7) 单 击 Solve， 得 到 的 支 染 优化 结 末 如 图 9-22 所 示 。 
从 图 9-22 中 可 以 看 到 ，(D 区 域 为 建议 保留 部 分 ， 书 区域 为 建议 挖 去 部 分 。 在 
得 到 拓扑 优化 的 计算 结果 后 ， 可 以 回 到 DesignModeler 几何 建 模 中 ,新 生成 几何 模 
， 再 加 载 载荷 工 况 ， 对 优化 结果 进行 检验 。 





图 9-22 ”优化 结 有 果 
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